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第 1 章 导 论 
1.1 引 言 


最 优 控制 理论 是 现代 控制 理论 的 重要 组 成 部 分 ,其 形成 与 发 展商 定 了 整个 现代 控制 

论 的 基础 。 早 在 20 世纪 50 年 代 初 ,就 开始 了 对 最 短 时 间 控 制 问题 的 研究 ;随后 ,由 于 空 
辣 技 术 的 发 展 , 越 来 越 多 的 学 者 和 工程 技术 人 员 投身 于 这 一 领域 的 研究 和 开发, 丈 步 形 成 
了 一 套 较为 完整 的 最 优 控制 理论 体系 。 

最 优 控制 理论 研究 的 主要 问题 是 :根据 已 建立 的 被 控 对 象 的 时 域 数学 模型 或 频 域 数 
学 模型 ,选择 一 个 容许 的 控制 律 ,使 得 被 控 对 象 按 预定 要 求 运行 ,并 使 给 定 的 某 一 性 能 指 
标 达 到 最 优 值 .从 数学 观点 来 看 ,最 优 控制 理论 研究 的 问题 是 求解 一 类 带 有 约束 条 件 的 泛 
函 极 值 问题 ,属于 变 分 学 的 理论 范畴 。 然 而 ,经 典 变 分 理论 只 能 解决 容许 控制 属于 开 集 的 
-类 最 优 控制 问题 ,而 工程 实践 中 所 遇 到 的 多 是 容许 控制 属于 闭 集 的 一 类 最 优 控制 问题 . 
对 于 这 一 类 问题 ,经 典 变 分 理论 变 得 无 能 为 力 , 因 而 为 了 适应 工程 实践 的 需要 ,20 世纪 50 
年 代 中 期 出 现 了 现代 变 分 理论 ,在 现代 变 分 理论 中 ,最 常用 的 两 种 方法 是 动态 规划 和 极 小 
值 原理 。 

动态 规划 是 美国 学 者 R.E. 贝尔 曼 于 1953 一 1957 年 为 了 优化 多 级 决策 问题 的 算法 
而 逐步 创立 的 。 贝 尔 曼 依据 最 优 性 原理 ,发 展 了 变 分 学 中 的 哈密 顿 - 雅 可 比 理论 ,解决 了 控 
制 有 闭 集约 束 的 变 分 问题 。 极 小 值 原理 是 前 苏联 科学 院 院 士 mc. 庞 特 里 亚 金 于 1956 年 
至 1958 年 间 逐 步 创 立 的 。 庞 特 里 亚 金 在 力学 哈密 顿 原理 启发 下 ,进行 推测 ,并 证 明了 极 小 
值 原理 的 结论 ,同样 解决 了 控制 有 闭 集约 束 的 变 分 问题 .动态 规划 与 极 小 值 原理 是 现代 变 
分 理论 中 的 两 种 卓有成效 的 方法 ,推动 了 最 优 控制 理论 的 发 展 。 

近年 来 ,由 于 数字 计算 机 的 飞速 发 展 和 完善 ,逐步 形成 了 最 优 控制 理论 中 的 数值 计算 
法 。 当 性 能 指标 比较 复杂 ,或 者 不 能 用 变量 显 函数 表示 时 ,可 以 采用 直接 搜索 法 ,经 过 若干 
次 欠 代 ,搜索 到 最 优点 。 常 用 的 数值 计算 法 有 邻近 极 值 法 、 梯 度 法 、. 共 斩 梯 度 法 及 单纯 形 法 
等 ,同时 ,由 于 可 以 把 计算 机 作为 控制 系统 的 一 个 组 成 部 分 ,以 实现 在 线 控制 ,从 而 使 最 优 
控制 理论 的 工程 实现 成 为 现实 .因此 ,最 优 控制 理论 提出 的 求解 方法 ,既是 一 种 数学 方法 ， 
又 是 一 种 计算 机 算法 ， 

时 至 今日 ,最 优 控制 理论 的 研究 ,无 论 在 深度 和 广度 上 ,都 有 了 很 大 的 发 展 ,并 日 益 与 
其 他 控制 理论 相互 渗透 ,形成 了 更 为 实用 的 学 科 分 支 .如 鲁 棒 最 优 控制 .随机 最 优 控制 、 分 
布 参数 系统 的 最 优 控制 及 大 系统 的 次 优 控制 等 可 以 说 ,最 优 控制 理论 目前 仍然 是 正在 发 
展 中 的 ,极其 活路 的 学 科 领 域 之 一 。 


1.2 最 优 控制 问题 


1.2.1 最 优 控制 实例 
例 1-1 最 大 面积 问题 。 


设 一 渔 轮 进行 围 网 作业 ,如 图 1-1 所 示 。 已 知 渔 轮 相 对 海流 的 速度 为 ”其 大 小 不 变 。 
作业 区 海流 速度 w 的 大 小 和 方向 一 定 。 求 渔 轮 方位 角 0(z) 的 最 优 变化 律 , 使 渔 轮 在 给 定 


图 1-1 渔 轮 围 网 作业 图 


例 1-2 最 小 燃 耗 问题 。 


时 间 吉 内 所 围 的 海域 面积 4 最 大 。 


选 海流 速度 w 的 方向 为 x 轴 , 重 直方 
向 为 y 轴 , 则 渔 轮 的 运动 方程 为 
T(t)=vecos0() tw 
y(t)=vsin0(t) | 
初始 条 件 与 末端 条 件 为 
| 
y(0)=y(t)= yo 
要 求 确 定 最 优 控制 律 9Xz), 使 下 列 代表 面 
积 的 性 能 指标 为 最 大 


J 二 Pyar = | yd 


(1-1) 


(1-2) 


=| yt) [veos0 Ct) +wld (1-3) 


为 了 使 宇宙 飞船 登 月 舱 在 月 球 表 面 实 现 软 着 陆 , 即 登 月 舱 到 达 月 球 表面 时 的 速度 为 
零 ， 要 寻求 登 月 舱 发 动机 推力 的 最 优 变化 律 ,使 燃料 消耗 最 少 ,以 便 在 完成 登 月 考察 任务 
后 , 登 月 舱 有 足够 燃料 离开 月 球 与 母 船 会合 , 从 而 返回 地 球 。 

设 飞 船 登 月 舱 质 量 为 m(z) ,高 度 为 h(z), 垂 直 速 


度 为 v(t) ,发 动机 推力 为 u(t) ,月球 重力 加 速度 为 常数 | 
g, 飞 船 登 月 般 不 含 燃 料 时 的 质量 为 M, 登 月 舱 所 载 燃 

料 质量 为 ,已 知 登 月 舱 登 月 时 的 初始 高 度 为 ,初始 0 
甜 直 速 度 为 mw。 登 月 舱 在 月 球 上 实现 软 着 陆 的 示意 图 (Nn 
如 图 1-2 所 示 。 由 图 可 列 出 登 月 舱 的 运动 方程 为 


h(t)=r() 


u(t) 
m(t) 


»(£) 一 


m(t) = — ku(l) 


式 中 为 常数 。 
急 始 条 件 为 


& 


-wD) me 


IN、 


图 1-2 登 月 舱 软 着 陆 示 意图 


(1-4) 


h(0)=ho 


m(0)=M+F 


末端 条 件 为 


机 (1-6) 
vy (tyr) —0 
式 中 心 为 登 月 舱 发 动机 工作 的 末 闪 时 刻 。 
控制 约束 条 件 
Ou) Umer (1-7) 


式 中 ms 为 登 月 舱 发 动机 最 大 推力 。 

性 能 指标 取 为 表征 燃料 消耗 量 的 登 月 舱 着 陆 时 的 质量 , 即 

J 一 712CtEr) (1-8) 

最 优 控制 任务 是 :在 满足 控制 约束 条 件 下 ,寻求 发 动机 推力 最 优 变化 律 u*(z) ,使 登 月 
肥 由 已 知 的 初 态 ( 初 始 状 态 ) 转 移 到 要 求 的 末 态 (末端 状态 ), 并 使 式 (1-8) 为 最 大 ,从 而 使 
登 月 过 程 中 燃料 消耗 量 最 小 。 

例 1-3 最 快 拦 截 问题 。 

设 空中 有 一 榴 敌 方 导弹 M( 称 为 目标 ) 和 一 枚 我 方 反 导 弹 导 弹 工 ( 称 为 拦截 器 )。 已 知 
MM 以 mm 做 等 速 飞行 ,其 重力 加 速度 为 8 江 的 质量 为 ze 人 zt) ,满载 燃料 时 的 质量 为 mx.(0), 燃 
料 消耗 完毕 时 的 质量 为 m., 发 动机 推力 为 P(t) ,单位 推力 的 燃料 消耗 率 为 带 数 &, 推 力 的 
方位 角 为 6() ,发 动机 的 最 大 推力 限额 为 pv。 作战 任务 要 求 确 定 工 推力 及 其 方位 角 的 最 
优 变化 律 p" (和 2” (2) ， 以 便 在 空中 尽快 挫 筑 目标 M。 

为 便于 研究 起 见 , 假 定 工 与 M 在 同一 平 | 
面 内 运动 ,如 图 1-3 所 示 。 由 图 可 列 出 目标 M 让 uy 


Zult)=vy(t) 0 2 


Yu (lt) =—=ym,(t) 


(1-9) 


Duy(t) = —g 
式 中 (zwyyw) 表 示 平 面 上 目标 M 的 位 置 , (vw,， 
vmy) 表 示 目 标 M 的 速度 。 
阁 以 《zz ,yi) 表 示 平 面 上 工 的 位 置 , (vi,， 
viy) 表 示 上 的 速度 , 则 其 运动 方程 为 
TL(t) y(t) 
y(t) = (t) 


be (0) = BScos00) (1-10) 


p(t) 
mt{(t) 
m(t)=kp(t) 
为 了 进一步 简化 运动 方程 , 取 相 对 运动 坐标 系 。 令 工 与 目标 的 相对 位 置 及 相对 速 
度 为 


图 1-3 最 快 拦截 问题 示意 图 


Dj, (£) = sing (1)—g 


rt)=x tt) — Tut) 
y(1)= Y(t) — Yult) 
ye(t) v(t) — Vu lt) 
DC) 一 VD (tt) — vm, (t) 
于 是 ,拦截 器 与 目标 的 相对 运动 方程 可 写 为 
Tt) = (t) 
y(t)=y,(t) 


p(t) 
mose lt) (1-12) 


p(t) 
mt) 


mt{t)=Ekp(t) 


(1-11) 


yz) 一 


sin0 (ft) 


VD,(t) 一 


初始 状态 
Zito) 一 TY(0)， y(to)=y(0), 的 
y(to)=y.(0), vyv,(to)=v,(0) 


(1-13) 


式 中 b 为 初始 时 刻 。 
ZTCtr 一 ytr) 一 0 
17 ) 之 112。 | (4 
其 意义 是 要 求 拦 截 器 在 燃料 消耗 完毕 前 击 中 目标 。 
控制 约束 为 
[|p(2) | pu 
90(z) 不 限 | 


(1-15) 


性 能 指标 取 为 
J=| /dt (1-16) 


最 优 控制 任务 是 :在 容许 控制 中 确定 p* (2) 和 0" (2) ,使 拦截 器 从 已 知 初 态 转移 到 
要 求 的 末 态 ,并 使 给 定 的 性 能 指标 极 小 (时 间 最 短 )。 

例 1-4 最 大 半径 轨道 转移 问题 。 

已 知 宇宙 飞船 沿 环形 地 球 轨道 飞行 , 现 要 求 用 有 限 推力 的 小 火 第 发 动机 在 预定 时 间 
tj 内 ,使 飞船 转移 到 最 大 半径 的 环形 火星 轨道 上 , 试 确定 小 火箭 发 动机 推力 方位 角 的 最 优 
变化 律 。 z 

设 字 宙 飞船 小 火箭 发 动机 的 推力 为 p, 其 大 小 恒定 ;推力 方位 角 为 9() ,宇宙 飞船 到 
引力 中 心 的 径 向 距离 为 >(z) ,地 球 轨道 的 径 向 距离 为 (0) ,火星 轨道 的 径 向 距离 为 + (zy)， 
宇宙 飞船 速度 向 量 的 径 向 分 量 为 u(t) , 切 向 分 量 为 v(t) ,宇宙 飞船 的 质量 为 m, 燃 料 消耗 
率 为 常数 m, 引 力 中 心 的 引力 常数 为 4。 低 推力 最 大 半径 轨道 转移 问题 如 图 1-4 所 示 。 

根据 力学 规律 ,可 以 列 出 系统 的 运动 方程 为 


se 


rr(t) =—=u(t) 
y(t) A psin0 (2#) 
rt) rl) mo— |mlt 


Uv(t) | pcos0(t) 


W(t) 一 


y(t) 一 


r(t) mo— [mlt 
(1-17) 
初始 状态 为 
r(0) 一 rm， wu(0)=0 
门 1 (1-18 ) 
y(0)= —， m(0)—=mo 
“0 图 1-4 最 大 半径 轨道 转移 示意 图 
末 态 要 求 为 
u(t/)=0, GD 一 A/ 0 (1-19) 
性 能 指标 为 
了 一 rr) (1-20) 


最 优 控 制 任务 是 确定 9" (2) ,使 宇宙 飞船 在 预定 时 间 sy 内 ,由 已 知 初 态 转移 到 要 求 的 
末 态 ,并 使 性 能 指标 ( 罗 道 转移 半径 ?最 大 。 


1.2.2 最 优 控制 问题 的 基本 组 成 


从 上 述 几 个 最 优 控制 的 实例 可 见 ,任何 一 个 最 优 控制 问题 均 应 包含 以 下 四 个 方面 内 容 。 
(1) 系统 数学 模型 
在 集中 参数 情况 下 ,被 控 系 统 的 数学 模型 通常 以 定义 在 时 间 间 隔 [t,,tyJ 上 的 状态 方 
程 来 表示 
: T= fx wu),t), Elto,ty)| (]-21) 
式 中 x€ R", 为 系统 状态 向 量 ;w€ R”, 为 系统 控制 向 量 , 在 确定 的 初始 状态 x(to) 二 xo 情况 
下 ,者 已 知 控制 律 wC), 则 状态 方程 (1-21) 有 唯一 解 x (7)。 
(2) 边界 条 件 与 日 标 和 集 / 
动态 系统 的 运动 过 程 ,归根 结 底 是 系统 从 其 状态 空间 的 一 个 状态 到 另 一 个 状态 的 转 
移 ,其 运动 轨迹 在 状态 空间 中 形成 一 条 轨 线 x(t)。 为 了 确定 要 求 的 轨 线 x) ,需要 确定 轨 
线 的 两 点 边界 值 。 因 此 ,要 求 确 定 初始 状态 和 末端 状态 ,这 是 求解 状态 方程 (1-21) 所 必需 
的 边界 条 件 。 
在 最 优 控制 问题 中 ,初始 时 刻 a 及 初始 状态 x(to) 通 常 是 已 知 的 ,但 末端 时 刻 tj 和 未 
癌 状 态 xGr) 则 视 具 体 问 题 而 异 。 例 如 ,未 端 时 刻 二 可 以 是 固定 的 (如 例 1-1, 例 1-2 和 例 
1-4) ,也 可 以 是 自由 的 (如 例 1-3)3; 末 端 状 态 x(Gtr) 可 以 是 固定 的 (如 例 1-1 和 例 1-2) ,也 可 
以 是 自由 的 (如 例 1-3), 或 者 是 部 分 固定 、 部 分 自由 的 (如 例 1-4) 。 一 般 , 可 用 如 下 目标 集 
加 以 概括 : 
yixC() ,tj=0 (1-22) 
式 中 yg € R',rn;x(tj)Eyg(。)。 若 末端 状态 x(ty) = 一 xyr 为 一 固定 向 量 , 则 目标 集 Jy (。) 
仅 有 一 列 元 素 xj; 藻 x(t/) 应 满足 某 些 约束 条 件 , 则 目标 集 g(，) 为 n 维 空间 中 的 r 维 超 


。 9。 


曲面; 若 x(z) 自 由 , 则 目标 集 几 (。，) 扩 展 到 整个 ” 维 空间 。 因此 ,目标 集 又 称 为 终点 流 形 。 

(3) 容许 控制 

在 实际 控制 系统 中 ,存在 两 类 控制 :一 类 是 变化 范围 受 限 制 的 控制 ,如 例 1-2 中 的 发 
动机 推力 和 例 1-3 中 拦截 器 的 推力 等 ,这 一 类 控制 属于 某 一 用 集 ; 另 一 类 是 变化 范围 不 受 
限制 的 控制 ,如 例 1-1 中 的 渔 轮 方位 角 和 例 1-3 中 拦截 器 推力 的 方位 角 以 及 例 1-4 中 宇宙 
飞船 小 火 第 发 动机 推力 的 方位 角 等 ,这 一 类 控制 属于 某 一 开 集 。 

在 属于 闭 集 的 控制 中 ,控制 器 量 w(z) 的 取 值 范围 称 为 控制 域 ,以 8 标志。 是 m 维 控 
制 空 间 R” 中 的 一 个 闭 点 集 。 由 于 wu(2) 可 在 的 边界 上 取 值 , 故 凡 属于 集合 2 且 分 段 连续 
的 控制 器 量 ww(2), 称 为 容许 控制 ,以 w(i1)EQ 标 志 。 

‘4) 性 能 指标 

在 状态 空间 中 ,可 采用 不 同 的 控制 向 量 函 数 去 实现 从 已 知 初 态 到 要 求 的 末 态 (或 目标 
集 ) 的 转移 。 人 性 能 指标 则 是 衡量 系统 在 不 同 控制 向 量 函 数 作 用 下 工作 优良 度 的 标准 。 

性 能 指标 的 内 容 与 形式 主要 取决 于 最 优 控制 问题 所 要 完成 的 任务 。 不 同 的 最 优 控制 
问题 ,有 不 同 的 性 能 指标 。 然 而 ,即使 是 同一 个 最 优 控制 问题 ,其 性 能 指标 的 选取 也 可 能 因 
设计 者 的 着 眼 点 而 异 。 例 如 ,有 的 要 求 时 间 最 短 , 有 的 注重 燃料 最 省 ,有 的 时 间 与 燃 耗 兼 
顾 。 应 当 指 出 ,性 能 指标 选取 的 合适 与 否 ,是 决定 系统 是 否 存在 最 优 解 的 关键 所 在 。 

在 控制 术语 中 ,性 能 指标 又 称 为 性 能 泛 函 、 目 标 函 数 或 代价 函数 。 


1.2.3 最 优 控 制 问 题 的 提 法 


根据 最 优 控制 问题 的 基本 组 成 部 分 ,可 以 概括 最 优 控制 问题 的 一 般 提 法 如 下 。 
设 系 统 状态 方程 及 初始 条 件 为 
Xi) 一 FLxzGD) wu) ,tt), x(to)=xo (1-23) 
式 中 xER";f(xs,u,t)ER", 是 x(i).wu(t) 和 1z 的 连续 向 量 函 数 , 并 对 x(1) 和 t 连续 可 微 ; 
ulz) 在 Lio,t/j 上 分 段 连续 , 且 xDECCR", 其 中 心 为 有 界 闭 集 ,Re" 为 m 维 完备 线性 赋 范 
空间 。 要 求 确定 最 优 控制 函数 wu" (2) ,使 系统 从 已 知 初 态 x(zo) 转 移 到 要 求 的 未 态 x(y) ,并 
使 性 能 指标 


j=9 [x(/) 十 | [re ,W(t) ,tdt (1-24) 


达到 极 值 ,同时 满足 : 
中 控制 不 等 式 约束 
g[x C(t) ,u(t) ,t=0 / (1-25) 
@) 目标 集 等 式 的 约束 
jxzGr)tr 一 0 (1-26) 
式 中 pLxbty),tyj 和 LLx() ,wbz) ,tj 是 连续 可 微 的 纯 量 函 数 ;g[x() ,wu() ,i] 是 p 维 连 续 
可 微 问 量 清 数 ,p 二 my [xGy),tyj 是 7 维 连 续 可 微 向 量 函 数 ,r 才 n。 


1. 3 性 能 指标 类 型 


性 能 指标 是 衡量 系统 在 任 一 容许 控制 作用 下 ,性 能 优 劣 的 尺度 ,其 内 容 与 形式 取决 于 


e 站 。 


最 优 控制 问题 所 要 完成 的 主要 任务 。 不 同 的 控制 问题 ,应 取 不 同形 式 的 性 能 指标 。 
(1) 积分 型 性 能 指标 
J 一 | [za ,t |di (1-27) 


表示 在 整个 控制 过 程 中 ,状态 x(t) 和 控制 uwQ) 应 达到 某 些 要 求 。 例 如 : 
1) 最 短 时 间 控 制 。 
取 LixC),wuC),tj 二 1, 则 有 


7 一 | di=i—u 
2) 最 少 燃 耗 控制 。 


取 LL[xG) ,wuG),tj 一 > |ujGQ)|, 则 有 
j=1 


/=| "> JujC2) |dt 


0 yj] 


3) 最 小 能 量 控制 。 
取 LixC) yu) ,it | 二 wu' Gu), 则 有 


=| wT ul de 


在 变 分 法 中 ,积分 型 性 能 指标 的 泛 函 极 值 最 优 控 制 问题 称 为 拉 格 朋 日 问题 。 
(2) 末 值 型 性 能 指标 : 
J=9 [x() ,ty) (1-28) 

表示 系统 在 控制 过 程 结束 后 ,末端 状态 x(ij) 应 达到 某 些 要 求 。 例 如 ,要 求 导弹 的 脱 靶 量 最 
小 ,末端 时 刻 tj 可 以 固定 ,也 可 自由 , 视 最 优 控 制 问 题 的 性 质 而 定 , 在 变 分 法 中 , 末 值 型 性 
能 指标 的 泛 函 极 值 最 优 控制 问题 称 为 还 耶 尔 问题 。 

(3) 复合 型 性 能 指标 

复合 型 性 能 指标 如 式 (1-24) 所 示 ,表示 对 控制 过 程 中 的 状态 xG)、 控 制 g&G) 及 控制 过 
程 结 束 后 的 末端 状态 x(ty) 均 有 要 求 ,是 最 一 般 的 性 能 指标 形式 。 例 如 : 

1) 有 限时 间 线 性 状态 调 古 右 问 题 。 


J=Fx Fr t+) Tx" HQ +u DR) ld (1-29) 
式 中 = 操守 0,0() 一 07(4) 之 0,RG) 一 RT(t) 这 0, 均 为 加 权 和 矩 阵 。 
2) 有 限时 间 线 性 跟踪 系统 问题 。 
J= 卫 erdr)Pedm) 十 于 | [er (Oe) Fut Ru Jdt (1-30) 
式 中 F=F' 宇 0,0GQ) 二 0 (4) 守 0,RG)=R'() 汪 >0, 有 是 
e(t)=z(t)— y(t) 


为 输出 误差 向 量 , 而 z(2) 为 希望 输出 向 量 ,y (7) 为 输出 问 量 。 
在 变 分 法 中 ,复合 型 性 能 指标 的 泛 函 极 值 问题 称 为 波 尔 扎 问题 。 


第 2 章 最 优 控制 中 的 变 分 法 


最 优 控制 问题 是 在 一 定 的 约束 条 件 下 ,寻求 使 性 能 指标 达到 极 值 时 的 控制 函数 。 当 被 
控 对 象 的 运动 特性 由 向 量 微分 方程 来 描述 ,性 能 指标 由 泛 函 来 表示 时 ,确定 最 优 控制 函数 
(最 优 控制 律 ) 的 问题 ,就 成 了 在 微分 方程 约束 下 求 泛 函 的 条 件 极 值 问题 。 变 分 法 是 研究 泛 
函 极 值 问题 的 数学 方法 ,可 以 确定 容许 控制 为 开 集 时 的 最 优 控制 函数 .掌握 变 分 法 的 基本 
概念 ,还 有 助 于 理解 以 极 小 值 原理 和 动态 规划 为 代表 的 现代 变 分 法 的 思想 和 内 容 。 


2.] 泛 函 与 变 分 


沁 曙 是 图 数 概 念 的 一 种 扩充 。 求 沁 函 极 值 的 方法 与 求 函数 极 值 的 方法 有 许多 类 似 之 
处 。 由 于 性 能 指标 是 一 种 泛 函 ,因此 本 节 将 简要 介绍 有 关 泛 函 及 其 变 分 的 若干 基本 概念 。 


2.1.1 线性 赋 范 空间 


控制 系统 的 状态 可 由 观测 决定 ,而 观测 值 总 是 近似 的 , 若 要 求 近似 值 能 任意 通 近 准确 
值 ,需要 在 状态 之 间 定 出 距离 量度 ,以 便 确切 规定 “任意 逼近 ”的 概念 ,因此 ,我 们 先 给 出 距 
离 空 间 的 概念 ,再 进一步 引出 赋 范 空间 与 内 积 空间 。 

定义 2-1 设 扎 为 非 空 集合 ,和 称 为 距离 空间 是 指 V x,yE 瑟 , 实 函 数 zx,y) 满 足 : 

(D d(x,y) 之 0,V x,yEX; 当 且 仅 当 x==y 时 ,d(x,y) 二 0; 

© d(x,y)=d(y,x); 

G) dxyy)<dCxzz) 十 dzy)， YY yzZEX。 
式 中 d(x,y) 称 为 上 的 距离 。 由 定义 2-1 知 , 若 动 点 x 无 限 通 近 定 点 xzo, 必 有 dxzyxo)- 一 0 
友之 亦 然 。 

定义 2-2 大 点 列 x,EX, 且 有 

i 

则 称 点 列 x 以 点 xo 为 极限 ,或 称 x, 收 伍 于 xo。 

定义 2-3 设 点 列 x,E€XX, 若 对 任意 的 se>0 均 存 在 一 个 足够 大 的 数 N ,使 得 当 m,n> 


N 时 ,有 

d (Xm Xn) LE 
则 称 刀 为 和 的 柯 西 序列 。 若 和 中 的 每 个 柯 西 序列 均 收 伍 于 X 中 的 一 点 , 则 称 X 为 完备 
的 距离 空间 。 z 


定义 2-4 在 和 中 ,点 集 
Sxo;T)= {xXEX|d(r, x0) r,t 0) 
称 为 以 点 xo 为 中 心 , 以 z 为 半径 的 开 球 。 设 对 于 子 集 MCX, 存 在 以 * 为 中 心 的 开 球 
SCx;E)CM, 则 点 xEX 称 为 集 M 的 内 点 。M 所 有 内 点 的 全 体 叫 做 M 的 内 部 , 记 作 IntM 。 
大 M 二 IntM, 即 2M 的 一 切 点 都 是 其 内 点 , 则 MM 称 为 开 集 。 
eH. 


定义 2-5 设 子 集 MCX, 共 以 点 x 为 中 心 的 开 球 SCx;e) 与 M 之 交集 非 空 , 即 
SC(x;e) {MAAO, YY 0 
则 点 xEX 称 为 M 的 附着 点 。M 所 有 附着 点 的 集 称 为 M 的 闭 包 , 记 作 MM。 奢 M= 二 MM, 则 
MCX 叫做 拷 集 。 
定义 2-6 知 对 于 线性 空间 R" 中 每 一 个 元 素 xE R" 都 可 定义 范 数 | x |x 一 尺 , 满 足 : 
QD | xj 宇 0, 当 和 且 仅 当 x=0 时 ,x 上 ==0; 
© | xtyl ri lylhvY x,yER"; 
B) | ax = 二 |a|，| x ja 为 任意 常数 。 
则 R" 称 为 线性 赋 范 空间 。 
定义 2-7 在 ?” 维 线性 空间 R" 中 , 若 用 数 积 定义 内 积 


(fy) 一 >》 VEyER 
i==1 


用 内 积 定 义 范 数 
x = x,x)z= | Da 
再 用 范 数 定义 距离 


d(x,y)= | x—yl=,) > (2 一 六， Vx,yER’ 
1 一 ] 


则 R" 也 称 为 希 尔 伯 特 空间 。 
定义 2-8 设 色 个 控制 函数 Ui(t) ,1 二 1,2,…,m, 定 义 在 时 间 闭 区 间 [to,ty] 上 , 则 对 
于 每 一 个 固定 的 1€ [i。,ty], 函数 向 量 
u(t)= [wt) ust) zs) 并 
是 m 维 空间 中 的 一 个 点 , 即 wu(i)E€ R", 和 且 设 w(t) 平 方 可 积 。 若 在 m 维 线性 空间 R” 中 定义 
内 积 


(u(t) GD 一 | wT vd 


=| Dvd Vu) wv ER" 


用 内 积 定 义 范 数 
uo 1=[ | Dewar 
则 R” 称 为 控制 向 量 项 数 空间 。 
定义 2-9 在 控制 向 量 函 数 空 间 R” 中 , 若 可 用 范 数 定义 距离 
dy) 一 外 2 人) 一 PC) | 
一 > uv)’dt | ， VY ult) v(t) ER” 


i 7= 1 


则 R” 也 是 线性 赋 范 空间 。 若 对 于 任 一 e>0, 都 存在 一 个 充分 大 的 自然 数 N ,使 得 ”> 入 
时 , 均 有 
d (usUo) EE, Vu,u ER” 


或 


limu, =— uo, vy HH, UER” 
FF — Cx 


则 称 向 量 函 数 序 列 wu, 收敛 于 向 量 函 数 wo, 或 称 R” 也 是 完备 的 线性 赋 范 空间 ， 


2.1.2 泛 湖 及 其 定义 域 

一般 地 说 , 若 对 于 某 类 函数 中 的 所 有 函数 z(b) ,变量 J 都 有 一 确定 的 值 与 之 对 应 , 则 
称 J/ 为 依赖 于 函数 x 4) 的 泛 函 , 记 作 J 二 JLxQ)j], 泛 了 清 可 以 理解 为 “也 数 的 孙 数 ”, 其 值 由 
函数 的 选取 而 定 。 例 如 ,函数 的 定 积 分 是 一 个 沁 函 。 设 


] 
(zx) =| T(E) di 
0 


则 J Cz) 的 值 由 明 数 xX) 而 定 。 当 x)==it 时 
J(Cz) 一 二 


当 x(t) 二 cost 时 

J(X)=sinl 

又 如 ,平面 上 给 定 两 点 之 间 的 曲线 长 度 是 一 个 泛 
图 。 设 (zy,y) 平 面 上 有 4.、 8 两 点 ,其 坐标 取 为 
4(xzoyyo) 和 已 (Cz) 如 图 2-1 所 示 。 设 两 点 间 曲 
线 长 度 为 /三 !, 取 单元 弧 长 为 qd, 则 有 


dz 一 Vv (dr):+ (dy)’ 


O * 单元 弧 长 变化 率 
dl | 
图 2-1 平面 上 给 定 两 点 间 的 曲线 长 度 到 一 YI 十》 
因而 4、B 两 点 间 曲 线 长 度 


J[y(z] 一 一 | VIT 十 六 dx 


其 值 取决 于 函数 y(z) 的 选取 。 

因此 ,最 优 控制 问题 中 的 性 能 指标 ,由 于 其 值 取 决 于 控制 &( 和 状态 x*( 世 的 选取 , 必 
定 是 一 个 泛 函 , 故 又 称 为 性 能 泛 隐 .性 能 泛 函 可 以 看 作 是 线性 赋 范 空间 中 的 某 个 子 集 到 实 
数 集 的 算 子 ,其 定义 如 下 。 

定义 2-10 设 R" 为 n 维 线性 赋 范 空间 ,R 为 实数 集 , 若 存在 一 一 对 应 关系 


y=J(x), VxER’,yER (2-1) 

则 (x) 称 为 R" 到 及 的 泛 函 算 子 。 若 式 (2-1) 满 足下 列 线性 条 件 : 
(CD) J Nx) =J XI (x) Vx x ER’ (2-2) 
©) (ax)—~a(x), VxXER’ (2-3) 


则 J(x) 称 为 线性 泛 也 算 子 。 

在 许多 问题 中 ,只 确定 所 用 的 函数 空间 是 不 够 的 ,因为 泛 函 算 子 J 不 一 定 在 空间 的 
任意 元 上 都 有 定义 ,因此 引出 泛 函 定义 域 的 概念 。 

定义 2-11 在 线性 赋 范 空间 R" 上 ,使 泛 函 算 子 j 作用 有 意义 的 元 的 全 体 , 称 为 J 的 


* | 0。 


定义 域 , 记 作 D(J);D(J) 在 J 作用 下 的 集合 , 称 为 J 的 值 域 , 记 作 

: ZJ)={y|y=J (x),xE DC),) 

为 了 讨论 泛 函 J (x) 的 性 质 和 运算 ,需要 .JJ(x) 为 连续 的 条 件 。 如 果 在 线性 赋 范 空间 R” 
中 , 当 x 一 xoln 王 00) 时 ,x ER" ,XoE R", 对 应 有 J (x.)J (xo) (nco0), 则 这 样 的 泛 昭 算 
子 J(x) 是 连续 的 。 

定义 2-12 设 J(x) 是 线性 赋 范 空间 R” 中 子 集 DC) 到 实数 集 R 中 的 泛 函 算 子 , 阁 
对 于 每 一 个 收敛 于 xoE D(C) 的 序列 x,ED(J), 均 有 

limJ (x) J (xo) (2-4) 
则 称 泛 函 算 子 了 在 x 处 连续 。 若 泛 函 算 子 J (x) 在 子 集 D(J) 上 的 每 一 点 都 连续 , 则 称 泛 
函 算 子 在 D(7) 中 连续 。 

由 于 泛 了 清 J (x) 定 义 在 线性 赋 范 空间 上 ,因此 对 于 线性 泛 也 J (x), 若 
| —x| 一 0 (no0), Vx xER’ 

时 , 必 有 

[mv (xn) ~— J (x) 
则 线性 泛 隐 J(x) 是 连续 的 。 实际 上 ,这 种 泛 孙 最 重要 ,因为 它 在 任何 一 点 上 的 值 可 用 该 点 
附近 的 泛 函 值 任意 逼近 。 在 有 限 维 线性 空间 上 ,任何 线性 泛 函 都 是 连续 的 。 


2.1.3 江 函 的 变 分 


研究 沁 泪 的 极 值 问 题 ,需要 采用 变 分 法 。 变 分 在 泛 函 研究 中 的 作用 ,如 同 微分 在 函数 
钱 究 中 的 作用 一 样 。 泛 函 的 变 分 与 函数 的 微分 ,其 定义 式 几乎 完全 相当 ， 
为 了 定义 泛 卫 的 变 分 ,应 先 研 究 宗 量 的 变 分 。 设 J(x) 为 连续 泛 函 ,x(t)€ R" 为 宗 量 ， 
其 变 分 表示 式 为 
OX—=XxX(t)—xXot), x(t) ,x ER (2-5) 
变 分 6x 表示 R" 中 点 xb 与 xolt) 之 间 的 差 。 由 于 6x 存在 ,必然 引起 泛 函 数值 的 变化 ,并 
以 J (x 十 e6x) 表 示 。 其 中 为 参 变数 ,其 值 0 委 s 委 1. 当 e=1 时 ,得 增加 后 的 泛 函 值 J (x 十 
6x); 当 e 二 0 时 ,得 泛 函 原来 的 值 VCxz)。 泛 函 变 分 的 定义 如 下 。 
定义 2-13 设 J(x) 是 线性 赋 范 空间 R* 上 的 连续 泛 函 , 若 其 增 量 可 表示 为 
AJ (xX)=J (CX 十 6CxX) 一 JCY) 
一 了 (xz OX) 十 rr ,Ox) (2-6) 
式 中 L(x,6x) 是 关于 6x 的 线性 连续 泛 卫 ,r(x,6x) 是 关于 6x 的 高 阶 无 穷 小 , 则 
0. =L(x, Ox) 
称 为 泛 函 J (x) 的 变 分 。 z 
由 定义 2-13 知 , 泛 函 的 变 分 就 是 泛 函 增 量 的 线性 主 部 。 当 一 个 泛 函 具有 变 分 时 ,也 称 
该 泛 函 可 微 。 像 函数 的 微分 一 样 , 泛 函 的 变 分 可 以 利用 求 导 方法 来 确定 。 
定理 2-1 设 J(x) 是 线性 赋 范 空间 尺 " 上 的 连续 泛 函 , 若 在 x=xs 处 J(x) 是 可 微 的 ， 
xX,xXoEE R", 则 其 变 分 为 


OJ Cros6x) = T(xoedx) | 0<e<l (2-7) 


sa ] 1 。 


证 明 因 在 x==xo 处 JC(x) 可 微 , 必 在 x。o 处 存在 变 分 。 由 和 定义 2-13 有 
A = (xo E06x)— J (xo) 
一 上 (xyEs0OX) 十 YCxXoyEOX ) 
由 于 上 (xo,e6x) 是 关于 e6x 的 线性 连续 沁 孙 , 故 
L(xo,E0X)=EL(xo ,OxX) 
又 因 ”~(xo,s6x) 是 关于 se6x 的 高 阶 无 穷 小 , 故 


,r(xo, EO0X) 
jim 一 一 一 一 一 一 
一 二 位 已 


0 


二 是 
J (Xo EOX) — J (Xo) 


过 . 
ed) (Xo» EOx) [eo = lim 和 


一 lim 二 [ZLCxovebxr) 十 rCroyegx)] 


— 人 OJ (xy OX) 
例 2-1 试 求 下 列 连续 泛 孙 的 变 分 6J; 
1=| Lz,z,0)d 


式 中 过 和 并 为 标量 。 
解 由 定理 2-1, 得 


OJ = 六 | ‘J,(zxi+edr ,区 十 OZ )dt | 


可 以 证 明 , 沁 也 变 分 的 取 值 仅 是 判断 泛 函 极 值 存在 的 必要 条 件 , 为 了 确定 江 函 的 极 小 
值 或 极 大 值 ,需要 考察 泛 函 的 二 次 变 分 。 

定义 2-14 设 J(x) 是 线性 赋 范 空间 R" 上 的 连续 泛 函 , 若 在 x 二 xo 处 二 次 可 微 ,其 中 
XER' ,XoER', 则 泛 函 的 二 次 微分 J 中 (xo) (6x)’ 称 为 江阴 J(x) 在 += 二 xo 处 的 二 次 变 分 ， 
记 为 27 (xos6x)。 : 

根据 定义 2-14, 可 用 下 述 定理 确定 泛 函 的 二 次 变 分 。 

定理 2-2 设 J(x) 是 线性 赋 范 空间 R 上 的 连续 泛 函 , 若 在 x 二 xo 处 J(x) 是 二 次 可 
微 的 , 则 其 二 次 变 分 为 

7J (ros Ox) = (xoredx) so, 0<e<l (2-8) 


证 上 明 由 定义 2-14 


_ fo aL, 3L,, 
-| | 3 OTH dr 


Oxo x) = xo) (Ox): 
=~|J' (xo)6x cx 
式 中 
: J' (xo)Ox=6 xo 0x) 
由 定理 2-1 知 


ee 12 。 


3 (xos6x) = (xore6x) | 0<e<] 


所 以 
52J(x ,Br) 一 | J (ov eBx) pe Bx 


=- 汉子 = Crosedx) 7x | 


£0,7=0 


式 中 0 委 ?7 委 1。 于 是 证 得 


2 
8 (xos6x) = 3 (ros ex) ， 0<e 扫 1 


E 一 站 


2.1.4 泛 苯 极 值 与 变 分 引 理 


泛 函 极 值 及 其 达到 极 值 的 条 件 ,与 函数 极 值 及 其 达到 极 值 的 条 件 类 同 。 
(1) 泛 函 极 值 的 定义 
定义 2-15 设 J(x) 是 线性 赋 范 空间 R" 中 某 个 子 集 乙 上 的 线性 连续 泛 图 , 扣 xzo6E 
D, 若 存在 某 一 正 数 ,使 集合 
U(xo0)— {x| | x—xo | <o,xER’) 


在 
XEU(xo oI)TCD 
时 , 均 有 
: AJ xz) 一 J(Cxz) 一 (xzo) 之 0 (2-9) 
则 称 泛 范 J(x) 在 x 二 xo 处 达到 极 小 值 ;大 / 
AJ(xX)=J(X)—J x0)EO (2-10) 


则 称 泛 也 J(x) 在 x 二 xo 处 达到 极 大 值 。 
(2) 泛 函 极 值 的 必要 条 件 与 一 次 变 分 
定理 2-3 设 J(x) 是 在 线性 赋 范 空间 R" 中 某 个 开 子 集 D 上 定义 的 可 微 泛 函 ， 日 在 x 
一 xo 处 达到 极 值 ,其 中 xE€ER",xoE R", 则 泛 孙 J(x) 在 x 二 xo 处 必 有 
OJ (xo OxX)=0 (2-11) 
证 明 对 于 任意 给 定 的 6x,J (xo 十 e6x) 是 实 变 量 @ 的 图 数 ,0 委 e 委 1。 由 假设 , 泛 郴 
J(xo 十 Ee6x) 在 es 一 0 时 达到 极 值 , 故 其 导数 在 e 二 0 时 应 为 零 , 即 


J (xotedx) | ,一 0 
因 沁 本 yxz) 可 微 , 其 一 次 变 分 存在 ,由 和 定理 2-1 得 
BJ (xosOx) = (xot edx) | ,一 0 

由 定理 2-3 可 知 ,一 次 恋 分 为 零 是 泛 果 达到 极 值 的 必要 和 条件。 

(3) 水 苯 极 小 值 的 充 要 条 件 与 二 次 变 分 

定理 2-4 设 J(x) 是 在 线性 赋 范 空间 R" 中 某 个 开 子 集 D 上 定义 的 沁 孙 , 且 在 x 二 x。 
处 存在 二 次 变 分 ,其 中 XER',XoER, 如 果 

OJ (xosOx)=0, J(xo ox)>0 (2-12) 


.13* 


则 泛 函 J (x) 在 x 二 xo 处 达到 极 小 值 。 
证 明 ”对 于 给 定 的 x。 和 6x, 泛 冰 J (xo 十 Ee6x) 是 实 变量 8 的 涌 数 。 令 
os) 一 .1(xo 十 Ex)， OZeSl 
则 由 函数 极 小 值 的 充 要 条 件 知 ,对 于 Ye) 在 s=0 时 达到 极 小 值 ,应 有 


一 0 


E 一 心 


9 
FePE) 


gle) 
于 是 ,由 定理 2-1 及 定理 2-2 得 泛 函 J (x) 在 x 二 xo 处 达到 极 小 值 的 充 要 条 件 为 
OJ (xo Sx)—=0, HJ(xosSx)>0 


类 似 于 定理 2-4, 可 证 得 泛 肾 J(x) 在 x 二 xo 处 达到 极 大 值 的 充 要 条 件 为 
OJ (xo sOx)=0, EJ (xosOx)<0 (2-13) 


>0 
£—0 


(4) 变 分 引 理 
为 了 次 入 研究 控制 系统 在 无 约束 条 件 和 有 约束 条 件 下 的 动态 最 优化 问题 ,需要 应 用 
如 下 变 分 引 理 。 
定理 2-$ 设 6 (1) 是 时 间 区 间 [io,ti]j 上 的 维 连 续 向 量 函 数 , 若 对 于 nn 维 任意 的 连续 
向 量 锁 数 7 (24), 其 边界 条 件 为 
7 (to)=7 (11)=0 
均 有 


| GD3 (di 一 0 (2_14) 


则 
6 (2)=0, VitE€ [to,t)] 
证 明 采用 反 证 法 。 设 (4) 关 0,t1E [ios,t1]。 因 为 
E00)=[é (0) &00) 有 (本 
不 失 一 般 性 , 令 合 (4) 汪 0, 而 GQ)==0,i=2,3,"…,n,2€ [tost,]。 
由 于 & (2) 连续 , 故 必 存在 一 个 邻 域 
(toyt1) Cltost | 
使 得 6 声 二 t 过 ti1 才 t 时 ,有 
1(1)>0, VY iE (to,0) 
取 连 续 标 量 函 数 外 () 在 邻 域 必 ,ti) 内 为 正 , 邻 域外 为 零 , 即 


0 ， to 
noeiveiy, to<t<t 
0， tt 
并 取 | 
| 7(t)=0, j=2,3,.,n 
由 于 7 (2) 在 Lt,ti] 上 连续 ,和 且 有 7 Go) 二 7 人) 一 0, 故 积分 式 


| #7 (2 di =| 4 (1)71C£) dt 


=|'& (GD) (io) (tt—i) di>0 


与 原 有 条 件 式 (2-14) 矛 盾 ,因此 本 定理 结论 成 立 。 
2.2 欧 拉 方程 


变 分 法 电 是 从 推导 沁 函 极 值 的 必要 条 件 开始 。 本 节 将 根据 2. 1 节 给 出 的 泛 函 及 其 变 
分 的 一 般 概念 ,针对 拉 格 朗 日 问题 ,导出 无 约束 及 有 约束 情况 下 泛 函 极 值 的 必要 条 件 一 一 
欧 拉 方程 ,又 称 为 欧 拉 - 拉 格 朗 日 方程 .同时 ,为 了 判断 欧 拉 方程 求 出 的 泛 函 极 值 是 极 小 值 
还 是 极 大 值 ,我 们 还 讨论 了 泛 孙 极 小 值 的 充分 条 件 一 一 勒 让 德 条 件 。 


2.2.1 无 约束 江 通 极 值 的 必要 条 件 


人 研究 使 泛 沙 
J(CoD 一 | Lr de (2_15) 


过 到 极 小 值 的 问题 。 其 中 xER", 在 时 间 区 闻 [zo,z] 上 ,xz( 及 被 积 函 数 L(x ,x,t) 连 续 可 
微 。 要 求 确定 一 个 容许 函数 x*() ,使 泛 蛆 (2-15) 取 极 小 值 。 用 几何 语言 说 ,要 求 找 出 一 条 
容许 曲线 x "(1) ,使 给 定 函 数 L(x,x,) 沿 x*G() 的 积分 取 极 小 值 。 

如 果 x(i) 代 表 控 制 系统 的 状态 向 量 , 则 式 (2-15) 代 表 系 统 的 性 能 指标 。 变 分 问题 是 要 
求 在 状态 空间 中 确定 一 条 最 优 轨 线 ,使 给 定性 能 指标 (2-15) 达 到 极 小 值 。 由 于 控制 问题 是 
多 种 多 样 的 ,因而 变 分 问题 也 不 尽 相 同 。 

假定 现在 考虑 最 简单 的 两 端 固定 问题 ,其 及 zj 固定 ,两 点 边界 条 件 已 知 为 

X(to)=xo, Xxlty)=xry (2-16) 

则 无 约束 泛 函 极 值 问题 可 以 描述 如 下 。 

问题 2-1 无 约束 泛 函 极 值 问题 为 


min Cx) 一 | Lor,i,t)dt (2-17) 


式 中 L(x,X,t) 及 x(i) 在 [to,ty] 上 连续 可 微 ,to 及 固定 。 已 知 x(t0) 二 xoyx(21) 二 x ,x(4) 
ER", 求 满足 式 (2-17) 的 极 值 轨 线 x* (4)、。 

设 x"() 是 满足 边界 条 件 (2-16) 的 极 值 轨 线 ， 
X(t) 是 x "(1) 令 域 中 的 一 条 容许 轴线 ,如 图 2-2 所 > 
不 。X(t) 与 x'(2) 之 间 有 下 列 关 系 ; 


xX(E)—=rx "(tor() (2-18) 
X(t) = (OX) (2-19) ™ 
以 及 
X (ti 一 X (0)=xo O ! 


全 
Th 
~ 


Xir) 一 天 (tr) 一 X/ 
式 中 6x C2) 是 x(2) 的 一 次 变 分 ,8x(1) 是 (4) 的 一 图 2-2 端点 固定 的 极 值 曲线 
次 变 分 。 


将 式 (2-18) 和 式 (2-19) 代 人 泛 函 (2-15), 则 有 
UAC (2-20) 


因为 被 积 函 数 LC。 ) 连 续 可 微 ,所 以 泛 函 (x) 连 续 可 微 。 只 要 x() 任 意 通 近 x* (1), 必 可 
求 出 使 泛 函 (2-20) 取 极 值 的 必要 条 件 。 
定理 2-6 对 于 问题 2-1, 使 性 能 泛 孙 (2-15) 取 极 值 的 必要 条 件 , 是 轨 线 x(t) 满 足下 


列 欧 拉 方 程 : 
aL daL_ 
ax di ax 
证 明 对 于 式 (2-20), 由 于 LC(。) 及 x() 连 续 可 微 , 故 可 将 L(，。，) 在 极 值 轨 强 x* (4) 
处 展 成 泰勒 级 数 


工 
L(x* + ort tO LO i +| 3 ] _Ox 十 


式 中 HOT 代表 泰勒 展开 式 中 的 高 阶 项 。 于 是 , 泛 函 增 量 可 表示 为 
AJ(xX)=J(x’ or)—J(r') 


0 (2-21) 
工 
3 | .sz+HOT 


=| [Le 十 6x; Ox,t)— L(x ,x" ,£) Jdz 
_ [fsr/orL)T aL) 、， 
-| [( 经 5z+| 4 3#+HOT ld 


由 定义 2-13 知 , 泛 函 变 分 是 泛 函 增 量 的 线性 主 部 , 故 


yr/ioaL\T DT 
5=| [| 完 sz+| 完 Bx |dt (2-22) 
利用 分 部 积分 公式 , 式 (2-22) 中 的 第 二 项 为 
rr1DZ1 DZ frfd ar 
| 完 Bxdt 一 | 94 Bx 一 | | | Sxdt (2-23) 
于 是 , 式 (2-22) 可 写 为 
rr1DL dd Di DZ | 
3 一 | | 续 - | jxd: 十 | 完 Ox (2-24) 


由 定理 2-3 知 , 泛 函 取 极 值 的 必要 条 件 是 sy 一 0。 再 由 变 分 定理 2-5 知 ,由 于 6x 任意 ， 
故 式 (2-24) 为 零 等 价 为 


一 一 一 - 一 二 0 (2-25) 


以 及 


aLi! 
Sx) 一 | 5 | ] Bx (to) =0 (2_26) 
f ot + 一 加 


和 

ax 4 

式 (2-25) 即 为 要 求证 的 欧 拉 方 程 ,或 称 欧 拉 - 拉 格 朗 日 方程 ,而 式 (2-26) 则 是 求解 时 变 非 

线性 二 阶 欧 拉 方 程 (2-25) 所 需要 的 两 点 边界 值 。 对 于 问题 2-1 ,因为 两 端 固定 , 必 有 
Ox(to)=0, 6x(ty)=0 

因此 式 (2-26) 目 然 成 立 。 求 解 式 (2-25) 所 需 的 两 点 边界 值 就 是 问题 2-1 中 已 知 的 端点 条 

件 :x(io) 二 xo 和 x(Gr) 一 Yr。 式 (2-26) 一 般 称 为 横 截 条 件 ,将 在 下 节 专 题 讨论 ， 


。 |， 


2 aL 工 
加 


= 


例 2-2 设 沁 限 
J (x) =| CD 一 0]d 


边界 条 件 . 
+(0)=0, z| 到 | = 


求 使 泛 函 达到 极 值 的 极 值 轨 线 x (2)。 
解 ”对 于 本 例 

下 (rr 下) 一 三 一 并 

根据 欧 拉 方程 (2-25) ,得 
xX 十 X= 二 0 

其 通 解 为 

Z(t)=cicostc,sint 
代入 已 知 边 界 条 件 , 求 出 

c1 一 0， cy 一 2 

因此 , 泛 函 极 值 只 能 在 下 列 极 值 轨 线 上 实现 


T(t)=2sint 
2. 2.2 有 等 式 约 束 的 泛 函 极 值 的 必要 条 件 


了 解 无 约束 泛 郴 极 值 的 必要 条 件 ,对 于 掌握 变 分 法 的 基本 概念 是 重要 的 。 然 而 ,实际 
系统 都 有 其 目 身 的 运动 规律 ,这 种 规律 的 数学 描述 就 是 系统 的 运动 微分 方程 式 。 在 求解 实 
际 系统 的 最 优 控制 问题 时 ,我 们 要 求 使 性 能 泛 函 取 极 值 的 极 值 轨 线 ,同时 满足 系统 的 运动 
微分 方程 式 。 因 此 ,控制 系统 的 最 优化 问题 ,是 要 求 确 定 在 微分 方程 等 式 约束 条 件 下 的 证 
函 极 值 , 即 条 件 极 值 的 变 分 问题 。 

在 讨论 条 件 极 值 的 变 分 问题 时 ,我 们 仍然 先 考虑 最 简单 的 两 端 固定 问题 . 设 性 能 泛 孙 
为 拉 格 朗 日 问题 ,系统 运动 微分 方程 取 为 | 

fx,x,t)—0 (2-27) 
式 中 xER",f(。，) 为 n 维 辐 量 函 数 。 于 是 ,有 等 式 (2-27) 约 束 的 泛 函 极 值 问题 可 以 描述 
如 下 。 
问题 2-2 ”有 等 式 约束 的 泛 函 极 值 问题 为 


minJ (x) =| gx tot)dt (2-28) 
x to 


st. f(x,x,t)=0 (2-29) 
式 中 glx,x,t) 及 x(t) 在 [to,tj] 上 连续 可 微 ,to 及 zi 固定 。 已 知 x(10) 一 xoyx(1) 二 xj ,XE 
R",f(。)ER"。 求 满足 式 (2-28) 及 式 (2-29) 的 极 值 轨 线 x* (4)。 
如 末 引 入 拉 格 朗 日 乘 子 问 量 ,可 以 把 有 约 东 的 泛 也 极 值 问题 化 为 无 约束 的 泛 函 极 值 
问题 , 则 由 定理 2-6 立即 可 得 条 件 泛 函 极 值 的 必要 条 件 。 
定理 2-7 对 于 问题 2-2, 在 约 东 条件 (2-29) 下 ,使 泛 函 (2-28) 取 极 值 的 必要 条 件 , 是 
轨 线 x(t) 满 足下 列 欧 拉 方 程 ; 


aL_ do (2-30) 


doi i 


ax dt 9x | 
式 中 | 
L(xoXAt)=po Cx, XL) TA (0) Fx ,Xt) . (2-31) 
在 式 (2-31) 中 ,4 € R", 为 待定 拉 格 度 日 习 子 问 量 ，。 
证 明 ” 设 4 G4)E€ R" 为 待定 拉 格 腿 日 乘 子 , 构 造 广义 泛 郴 


1s=| [grist) tAT OF Cet) dt 
令 拉 格 朗 日 函数 
LXSKXA = gCKXIEL HA CF x, ) 
则 广义 泥 郴 可 表示 为 
J.=| L(A ,dz 


于 是 , 原 性 能 泛 函 的 条 件 极 值 问 题 转化 为 广义 泛 消 的 无 条 件 极 值 问 题 。 根 据 定理 2-6, 立 
即 得 到 式 (2-30)。 由 于 两 端 固定 ,因此 求解 欧 拉 方 程 (2-30) 的 两 点 边界 值 ,就 是 问题 2-2 
中 已 知 的 两 点 边界 条 件 ,x(t0) 一 xo 及 x(t/) 二 xj。 

在 应 用 定理 2-7 时 ,车 将 式 (2-31) 代 入 式 (2-30), 则 欧 拉 方程 形式 为 


诺 ? 轩 中- 二 | 轴 轨 = 人 
如 采 问 题 2-2 中 的 约束 方程 为 
/ f(x,t)=0 
则 欧 拉 方程 (2-32) 简 化 为 | 
[+| 34 一 于 58 一 0 (2-33) 


例 2-3 设 人 造 地 球 卫 星 姿态 控制 系统 的 状态 方程 为 


0 1 0 
oO-[ 1]-o+[oe 
OQ 0 1 


1 
| 2 C2) dz 
0 


l 0 
ee 
l 0 


求 使 性 能 泛 盟 取 极 值 的 极 值 轨 线 x" (z) 和 极 值 控 制 w* (7)。 
解 由 题 意 


性 能 泛 函 取 为 


边界 条 件 


。 18 。 


令 


则 拉 格 翩 日 标量 天数 


欧 拉 方程 


式 中 常数 a.6 待定 。 
由 状态 约束 方程 


L(xsu ,及 »£) 一 & 十 和 下 


一 于 好 十 思 (Xs 到] ) 十 4 (WC 一 区 2) 


aL d aL _ 


si, 
i em hit di 


az dt azx: 


aL da » ,| 
zs di zs MTT 


aL d aL 加 
au da 


Xt,(t)—=u=at—b 


Talt) = at:—btte 


ti(t) =z(t) = Hat bt 


X1(t) 一 Fat 一 56 十 ct 十 d 


式 中 积分 常数 c.d 将 待定 。 代 入 已 知 的 边界 条 件 , 求 得 


于 是 , 极 值 轨 线 


极 值 控制 


最 优 乘 子 


2 一 3， b=3.5,，, c= 二 1]， 4 一 ] 


zr (= tt ttt1 


2 
x 3 7 
be (= sttl 


2 (t)=3t—3.5 


ArY (1)=3 
A> (t ) 一 一 3 十 3. 8 
] 


2 
六 一 到 | uCdt=15.5 
2 Jo 


2.2.3 泛 函 极 小 值 的 充分 条 件 


欧 拉 方 程 只 是 泛 函 取 极 值 的 必要 条 件 。 为 了 确定 极 植 的 性 质 ,需要 给 出 泛 鲨 取 极 小 值 
的 充分 条 件 。 
(1) 无 约束 情况 
定理 2-8 对 于 问题 2-1 ,使 性 能 泛 函 (2-17) 成 立 的 充分 条 件 是 : 除 欧 拉 方 程 (2-21) 
应 成 立 外 ,下 列 等 价 勒 让 德 条 件 之 一 应 成 立 : 


527 3:L 
个 dx’ QO XA 0 (2.34) 
327 YY 92L 
xox ax’ 
a:L d 3237 3a:L 
2 ax2 di IxIr= 2 0 (2-35) 
a‘L d 932L 9 L 
(3) J rgi—0 i>0 (2-36) 
证 明 ” 泛 晴 增 量 
AJ(x)=J(xr" or)—J (rx’') 
=| [Lx TOxsx* Or) — Lr ,x* ,£) Jdz 
在 极 值 轨 线 人 处 ,泰勒 级 数 展开 式 
T 
L(x ox, 二 OX,t)=L(x" 0 十 | 号 5x 二 [经 OX 
1 "oor "2 .7/ 9L .+ 92L、. 
十 ;| EO 十 OX | 六 2 OX 十 6X TE |+ (2-37) 
将 式 (2-37) 代 人 AJ， 取 其 一 次 项 的 次 变 分 
1 2 2 
37 一 去 | [ar 5 Ox! i 4 6% |dt (2-38) 
式 (2-32) 为 二 次 型 积分 式 , 可 改写 为 
a°L aL 
1 ft ax’ OXOX Ox 
| Sx! bx! | | ~ 
7 上 xX! | j27 27, | Las (2-39) 
dXAax dx 


由 定理 2-4 知 ,在 式 (2-17) 成 立时 , 泛 函 取 极 小 值 的 充分 条 件 是 8J 之 0, 因 此 本 定理 
结论 中 成 立 。 
若 对 式 (2-38) 被 积 函数 的 第 二 项 进行 分 部 积分 , 因 


,dd 
故 
2 
2|, Bx : dt -2| 3 r9L dor 
， dxXxor 
了 rd 9 :LL 本 9°L 4 ， 
本 ”下 53370xdt 十 20x xo) (2-41) 


»* 770. 


由 于 两 端 固定 ,SGxr(io)=GxGr) 一 0, 所 以 将 式 (2-41) 代 入 式 (2-38) 得 


41 raoL d 921 1 了 19L.,. 
0°J = 7 ,Ox rd rar xd 十 了 ,2 FiOxdt (2-42) 
由 式 (2-42) 可 见 , 当 本 定理 结论 书 或 @ 成 立时 , 必 有 让] 二 0。 


(2) 有 约束 情况 
定理 2-9 对 于 问题 2-2, 在 约束 条 件 (2-29) 下 ,使 性 能 泛 了 肾 (2-28) 成 立 的 充分 条 件 
是 : 除 欧 拉 方程 (2-30) 应 成 立 外 ,下 列 等 价 勒 让 德 条 件 之 一 应 成 立 : 


a2L a7L 
(1) Ox OO7 >0 (2-43) 
| 32L | a2L 
a xox a x? 
oa:L dd 93:7 9 LL 
(2) J di 3xai 0 F220 (2-44) 
ga d 92L aL 
3 了 起 一 下 xoi>0 可 二 之 0 (2-45) 


式 中 工 二 (x ,xX ,4 ,) 满 足 式 (2-31) ,4 为 维 拉 格 朗 日 对 子 向 量 。 
证 明 令 1 (ER 构造 广义 泛 本 
7.=| Losi,2 ,di 


起 中 L(x,*,4 ,满足 式 (2-31)。 因 为 L(x,*,4 ,) 连 续 可 微 , 故 在 极 值 轨 线 处 ,可 将 广义 
沁 函 J 展 成 泰勒 级 数 , 类 似 于 定理 2-8 的 证 明 过 程 ,立即 证 得 本 定理 结论 。 

例 2-4 设 性 能 泛 函 为 

T=| (2+)dt 

边界 条 件 / 
TXT(1)=]， TX(2)=2 
求 使 性 能 泛 蚂 J (zx) 为 极 小 值 的 最 优 轨 线 x* (4)， / 

解 本题 为 两 端 固 定 ,无 约束 泛 函 的 极 小 值 问 题 。 先 求 泛 函 极 值 。 由 题 意 


L(r,tst) = 


算得 
5 一 0， 2 一 一 1 十 221 
aL ~ 957 ， ， 
9zD 元 ~ 了 一 4 
由 定理 2-6, 欧 拉 方 程 为 
2 一 了 池 = 和 (+227) 一 0 
于 是 
l]+T2zt:=c 
《一 ] C1 
2 


* 21] 。 


式 中 
一方 (1 一 c) 


为 待定 常数 。 不 难 解 得 极 值 轨 线 


代入 已 知 的 边界 条 件 , 解 出 常数 


故 使 沁 函 为 极 值 的 极 值 罗 线 
XxX” (t) 一 3 一 二 


然后 ,利用 定理 2-8 判断 泛 沙 J(z) 在 x* (1:) 上 是 否 为 极 小 值 。 因 为 


se SE 


ax?: dt araxz 


5 一 2 0， VE[LL,2| 


所 以 求 出 的 zx" (2) 为 最 优 轨 线 ,相应 的 泛 函 极 小 值 
: J (zr ) 一 | 2 6 qs=3 


2.3 横 截 条 件 


求解 欧 拉 方程 ,需要 由 横 截 条 件 提供 两 点 边界 值 。 两 端 固定 且 初 始 时 刻 i。 和 末端 时 
刻 ij 同时 固定 只 是 一 种 最 简单 的 情况 。 在 实际 工程 问题 中 ,情况 要 复杂 得 多 。 例如 ,初始 
时 刻 和 末端 时 刻 可 以 自由 ;初始 状态 x(t。) 和 末端 状态 x(iy) 可 以 自由 ,也 可 以 受 约 束 。 在 
多 数控 制 工程 中 ,初始 时 刻 往往 是 固定 的 。 因 此 ,本 节 将 讨论 末端 时 刻 固定 和 末端 时 刻 自 
由 时 的 各 种 横 截 条 件 ,并 简要 介绍 初始 时 刻 自 由 时 的 横 截 条 件 。 


2.3.1 末端 时 刻 固 定时 的 横 截 条 件 
当 末 端 时 刻 固 定时 ,由 泛 函 极 值 的 必要 条 件 可 知 , 横 截 条 件 的 一 般 表达 式 为 
式 (2-26) , 即 


oa 
只 要 不 是 两 端 固定 问题 , 宗 量变 分 6x(t/) 和 6x(to) 不 可 能 同时 为 零 , 使 泛 函 一 次 变 分 8J 
一 0 所 缺少 的 条 件 ,就 应 当 由 极 值 的 基本 必要 条 件 来 补足 ,或 是 | 3 | | = 0, 或 是 


各 | | =0。 如 果 把 初始 状态 称 为 起 点 ,把 末端 状态 称 为 终点 , 则 因 ， 
起 点 固定 时 ， x(t6) 二 xo,6x(to)==0; 
起 点 目 由 时 ， Ox(to) 尖 0 
终点 固定 时 ， Xir) 一 XrOxCtr) 一 0; 

。92D 。 


aLy! aLl! 
完 ar 一 [ 强 ,x(a) =0 


终点 自由 时 ， 6xrGtr) 天 0 
所 以 ,可 把 末端 时 刻 固定 时 的 各 种 模 截 条 件 列 成 表 2-1 所 示 。 


表 2-1 末端 时 刻 固定 时 的 模 截 条 件 


序 号 名 称 模 截 条 件 

1 国定 起 点 和 终点 Xi) 一 Yo， YLr) 一 Y/ 
aL aL| 

2 自由 起 点 和 终点 3x | azl 
aL 

3 自由 起 点 和 固定 终点 Ep 一 Pak 

aL 
4 国定 起 点 和 自由 终点 Xlto) 一 Xo0， 5 本 


在 工程 问题 中 ,*(b90 一 般 表 示 运 动 轨 迹 , 如 飞机 或 导弹 的 飞行 轨迹 。 从 地 面 固定 发 射 
染发 射 , 到 达 固 定 地 面目 标的 地 对 地 导弹 的 飞行 轨迹 ,属于 固定 起 点 和 终点 问题 ;用 地 对 
空 导弹 射击 空中 目标 ,相当 于 固定 起 点 和 自由 终点 问题 ;在 空战 中 , 空 对 空 导弹 的 飞行 轨 
迹 , 属 于 有 目 由 起 点 和 终点 问题 ;利用 空 对 地 导弹 袭击 地 面 固定 目标 ,相当 于 自由 起 点 和 固 
定 终点 问题 。 


2.3.2 末端 时 刻 自 由 时 的 横 截 条 件 


末端 时 刻 上 自由 问题 的 实质 是 ,末端 时 刻 tj 不 固定 ,未 端 状态 或 自由 .或 受 约束 ,属于 
变动 病 点 问题 。 在 变动 端点 问题 中 ,可 以 证 明 , 极 值 仅 在 欧 拉 方程 的 解 * 一 *(iyciycy) 上 达 
到 ,其 中 c, 和 c; 为 求解 欧 拉 方程 的 待定 系数 ,由 横 截 条件 给 出 。 因此 , 泛 函 极 值 由 x(t,c,， 
cz) 一 类 图 数 确 定 。 例 如 , 敌 机 按 预定 轨迹 c(z) 飞行, 我 防空 导弹 从 时刻 发 射 追 击 敌 机 ， 
末端 时 刻 i 是 无 法 事先 规定 的 ,但 要 求 x(i) ==clzy) 以 保证 击落 敌 机 。 这 就 是 ty 自由 、 未 
疝 受 约束 的 变 分 问题 ,如 图 2-3 所 示 。 在 图 2-3 中 ,x* (2) 为 极 值 轨 线 ,x() 为 x" (4) 邻 域内 
的 任 一 条 容许 轨 线 , (xo ,to) 表 示 起 点 ;点 (xrostr) 到 点 (xrr 十 0Oxrotr 十 3) 则 表示 变动 端点 ， 
c() 表 示 端 点 约束 则 线 ,9zr 表示 末端 时 刻 变 分 ,为 微 变量 。 由 图 2-3 知 ,在 未 端 受 约束 时 ， 

存在 如 下 近似 关系 式 : 
Ox(t/)=6Oxs— X(tr)6t (2-46) 


2-3 末 闪 时 刻 自 由 时 的 变 分 问题 


。 23 。 


和 
Ox/=e(ty)0ts (2-47) 


如 果 末 端 自由 ,由 于 约束 曲线 c() 不 存在 ,; 则 仅 存 在 近似 关系 式 (2-46)。 

通过 点 (xosto) 的 容许 轨 线 形成 一 个 容许 轨 线 东 x 二 x(i,c1), 泛 明 J[Lx(t,ci)j 在 该 束 
曲线 上 转换 成 常数 cy 和 末 问 时 刻 t 的 陋 数 。 因 为 容许 轨 线 束 x 王 x(t ,ci) 在 所 考虑 的 极 值 
曲线 x* () 的 邻 域内 形成 一 个 中 心 场 ,所 以 可 由 ty 和 xj 的 值 确定 出 束 中 的 极 值 曲线 
x (1) ,从 而 也 就 确定 出 泛 函 的 极 值 。 

设 性 能 泛 阴 如 式 (2-15) 所 示 ,x (2) 与 x* (4) 之 间 关 系 如 式 (2-18) 和 式 (2-19) 所 示 , 当 
末端 由 (xjy,ty) 位 置 移动 到 (xy 十 6xj,ty 十 6ty) 位 置 时 ,产生 如 下 泛 孔 增 量 : 


tpt 加 | ty _ 
AJ =| L(xr* 十 Sr 二 92,2dz 一 | Lx” ,i* tdi 


t+odr i 
-| ‘Lx* 十 Ox," +6zt dt | [LOx 十 Ox TO) — L(x ,x ,1) ldt (2-48) 
ty to 


式 (2-48) 右 病 第 一 项 ,根据 积分 中 值 定理 可 变换 为 z 
| Lor tors i tO d=L Cr 十 8) 十 3 四 | +o04 
人 
式 中 0 和 2 和 1。 由 于 函数 L(。) 是 连续 的 ,因此 
LO 十 Or OL) | to —= Lx" ,x" ,t)|, el 
当 61/ 一 0,6x/ 一 0 时 ,有 81->0, 故 
A 十 OxYT 二 0X,t)dt=L(x' ,xX" ,tt)|, 0ts+t edty (2-49) 


对 于 式 (2-48) 石 端 第 二 项 ,将 被 积 函 数 在 极 值 轨 线 处 展 成 泰勒 级 数 , 有 
je 十 3 十 88, 一 人 Gd 


-外 [各 ex 二 | 各 | ‘atHor]e (2_50) 


dx 


对 式 (2-51) 中 的 第 二 项 进行 分 部 积分 ,得 


| 5 aa=[[ 下 | 2 


0 


将 式 (2-51) 代 入 式 (2-50) ,所 得 结果 代入 式 (2-48) ,同时 将 式 (2-49) 代 入 式 (2-48) , 取 
记 晃 增 量 的 线性 主 部 ,得 泛 酒 的 一 次 变 分 


J /==| | 半 -- 训 3] Bxdt 上 十 [| 守 | ox 


4 d aL 
-| (到 3 Srxdi (2-51) 


‘+L 着 ” 3) | ot 


ax di ax 
由 定理 2-3, 令 6J 二 0, 得 末端 变动 .tj 自由 时 泛 函 极 值 的 必要 条 件 
aL dd aL 
ax di ox (2-52) 
以 及 
9 了 1 37 1T 
3 eeo-| 淹 | or tL ,Open (2-53) 


式 (2-52) 称 为 欧 拉 方程 ,可 见 tj 自由 、 末 端 变 动 时 的 欧 拉 方程 形式 与 tj 固定 时 的 欧 拉 方 


* 4。 


程 完全 相同 ,这 一 结论 网 样 适用 于 有 等 式 约 划 的 泛 范 极 值 问题 ; 式 (2-53) 称 为 横 截 条 件 ， 
除 提供 求解 欧 拉 方程 所 需 的 两 点 边界 值 外 ,还 提供 了 一 个 确定 最 优 末端 时 刻 妇 所 需 的 边 
界 条 件 。 

未 踊 时 刻 且 由 、 末 疹 状 态 变 动 时 的 横 截 条 件 ,可 分 成 如 下 两 种 情况 讨论 。 

(1) 起 点 固定 ,末端 自由 

由 于 Xx(to) 二 xo, 故 6x(to)= 二 0。 在 末端 自由 情况 下 ,由 式 (2-46) 知 

OxCtr) 一 人 xr 一 着 (tr)Gztr 

将 上 式 及 xco)=0 代 人 式 (2-53) ,得 


ob - 4 革 和 贡 _ 
3 | LSxr 一 天 (tr)Gtr + Lr ,x* ,1) |,6t;=0 
‘f 


整理 得 
Lx | ot| 结 ] ,0 (2-54) 
人 在 式 (2-54) 中 , 因 Gj 及 6xj 任意 , 故 横 截 条 件 为 
[xr | 一 0 
aL (2-55) 
Ez3 jy 
X(to)=xo 
(2) 起 点 固定 ,末端 受 约束 
人 妈 末 师 约 束 方 程 为 


Xir) 一 CCtr) 
此 时 ,6xj 不 能 任意 。 由 式 (2-47) 知 

0OxXr 一 CCtr)Oir 
于 是 ,在 式 (2-54) 基 础 上 , 模 截 条 件 进一步 演化 为 


_ ral 2 | eapau= [L4G a)aL]| or- 
IL x (| 64+| 5 e084= |[L+ ee 鞠 ) EE | /=0 (2-56) 


在 并 (2-56) 中 , 因 6ij 任意 , 故 横 截 条 件 为 
9L 
| 二 (Ce 一直 5 


一 总 
’ (2-57) 
x(t/)=c(ty) | 


X(to) = Xo 
2.3.3 初始 时刻 自 由 时 的 横 截 条 件 


初始 时 刻 自由 问题 的 实质 是 :末端 固定 x(y) 一 xj, 初 始 时 刻 to 不 固 定 , 初 始 状 态 
x(to) 或 目 由 或 受 约束 。 例如 , 空 对 地 导弹 的 极 值 控 制 ,就 属于 起 点 受 约束 而 终点 固定 的 变 
分 问题 。 当 飞机 发 射 导 弹 攻 击 地 面 固定 军事 目标 时 ,为 了 提高 命中 率 并 躲避 敌 方 地 面 防空 
炮火 ,应 党 某 一 条 飞行 轨迹 J oz) 飞行, 故 在 发 射 导 弹 的 初始 时 刻 t。, 导 弹 运 动 轨 线 x(1) 与 
飞机 俯冲 轨 线 go (之 间 ,应 满足 如 下 关系 : 


e IF0 » 


X(to)=yo (£0) (2-58) 


设 初始 时 刻 自 由 时 的 变 分 问题 如 图 2-4 所 示 。 图 中 x" () 表 示 极 值 轨 线 ,x (2) 为 x* (2) 
邻 域 内 的 任 一 条 容许 轨 线 ,点 (xot) 到 点 (xzo 十 Sro,t 一 6to) 表 示 初 始 端 变 动 范围 ,6 表示 


初始 时 刻 变 分 ,为 微 变量 。 


如 (站 


一 一 一 一 一 一 一 一 上 一 一 一 ~ 


图 2-4 初始 时 刻 且 由 时 的 变 分 问题 


由 图 2-4 可 以 看 出 , 当 起 点 受 约 束 时 ,存在 如 下 近似 关系 式 : 
Ox(t0)=Oxot Xto) Oto (2-59) 


和 
5x 一 一 矶 (#0) 6i0 (2-60) 


如 果 起 点 自由 ,因为 约束 方程 (2-58) 不 存在 , 故 仅 存在 近似 关系 式 (2-59) 。 
设 性 能 泛 函 如 式 (2-15) 所 示 ,x(0) 与 x” (tf) 之 间 关 系 如 式 (2-18) 和 式 (2-19) 所 示 , 当 
起 点 由 (xo;zo) 位 置 移动 到 (xo 十 6x6o,to 一 6to) 位 置 时 ,产生 如 下 泛 函 增 量 、 


AJ =| L(x’ Ori" 上 30Dd 一 | Lox: ,di 
=| L(x Ox,X" +8x,0)dt+ | [Lx 十 OX 二 TOL) — L(x ,x" ,t) ld 
到 上 式 的 线性 主 部 ,得 泛 函 的 一 次 变 分 
aL d aL 


加 ， ty aL d aL T aL T 
oJ =L(x’ TOx,x +6t,0losn 十 | | dz 3 xdt+ | | 于 Ox | 


iy 


io 


令 6 二 0, 考 虑 到 6x 是 任意 的 , 故 泛 函 极 值 的 必要 条 件 为 


aL dd 3L 
3x ad 5 一 人 (2-61) 
以 及 


T T 
| arcD 一 | 经 | Ox(to) 十 ZX tox,x" +r,t)|, 6to 一 0 (2-62) 


dx 
式 中 式 (2-61) 为 欧 拉 方程 ,其 形式 与 式 (2-25)、 式 (2-30) 及 式 (2-52) 完 全 相同 ; 式 (2-62) 为 
初始 时 刻 且 由 时 的 横 截 条 件 , 可 分 为 如 下 两 种 情况 讨论 。 

(1) 末端 固定 ,起 点 受 约束 

由 于 来 闪 固 定 , 放 有 Gx (tr 一 0。 在 式 (2-62) 中 , 代 人 式 (2-59) 及 式 (2-60) ,得 


。 06。 


[+ (go —X)T 5 4=0 
因为 xs 任意 ,所 以 起 点 受 约束 时 的 横 截 条 件 为 

[+ 一 7 | =0 

X(to) = (to) 

x(t/)=xy 


(2) 未 问 固 定 , 起 点 目 由 
将 式 (2-59) 及 6x(zty) 二 0 代 人 人 式 (2-62), 得 


_.T9OL _{aL}: 
I x 3 | an 完 


在 起 点 上 自由 情况 下 ,6x。 和 6。 是 任意 的 , 故 横 截 条 件 为 


0OXN 一 0 
io 


X(tr)—=xy 
末端 时 刻 或 初始 时 刻 自 由 时 的 横 截 条 件 如 表 2-2 所 示 。 
例 2-5 已 知 初始 时 刻 t==0, 初 始 状 态 Xx(0)==1, 末 态 要 求 
rltr)=e(ts)=2~—ity 
式 中 末 痢 时 刻 tj 自由 。 求 使 泛 卫 


1/2 


7=|" (1 十 去) di 


为 极 值 的 最 优 罗 线 z "5 以 及 相应 的 克 和 .三 。 
解 本题 属于 疼 自由 、 起 点 固定 .末端 受 约束 的 变 分 问题 ,约束 方程 为 


(2-63) 


(2-64) 


ct 一 2 一 上 
表 2-2 末端 有 时刻 或 初始 时 刻 自由 时 的 模 截 条件 
序 号 名 称 横 截 条 件 
De 
1 起 点 固定 ,末端 自由 
| 邯 】 ,= X(t0) = Xo 
aL 
Li (tC—x) 1G—— 
2 . 起 点 固定 ,末端 受 约束 | 于 
Et 一 CC) ， x(t0)= wo 
L (wo 一 TO -一 
3 未 端 固定 ,起 点 受 约 东 [+ Wo || 0 
x(to)=polto), x(tf)=x/ 
[一 | ~0 
4 末 凋 固定 ,起 点 自由 3 了 
EE 寺 —0, xtr)=xr 


如 图 2-5 所 示 。 图 中 <(G) 为 一 条 任意 的 容许 轨 线 。 由 题 意 
忆 (z 二 划一 (1 十 二 3 


根据 欧 拉 方程 
daL_ da3L_ 0 
az dt ar 
求 得 
d 元 
| 二 二- 
积分 上 式 并 整理 得 
图 2-5 例 2-5 的 极 值 曲线 x(t)=at+ib 
式 中 a 和 6 为 待定 常数 。 
根据 横 截 条 件 (2-57) ,不 难 求 得 
a 二 1 b=1 


令 z(ty)= 二 c(zy) ,得 扩 一 本。 将 好 及 zx" (zt) 代 入 J, 得 "V2. 于 是 ,本 题 的 最 优 解 为 


x” (t)=t 二 1] 
1 二 二 

上 2 
1+_ V2 


最 优 轨 线 x* (1) 已 画 在 图 2-5 之 中 ,zx* (与 c() 正 好 正 交 。 因 此 ,对 积分 型 性 能 泛 函 而 言 ， 
横 截 条 件 又 称 为 正 交 条 件 。 


2.4 用 变 分 法 解 最 优 控制 问题 


在 控制 变量 的 取 值 不 受 约束 , 即 容 许 控 制 向 量 的 集合 可 以 充满 整个 函数 空间 ,同时 控 
制 问 量 是 时 间 的 连续 函数 情况 下 ,可 以 利用 变 分 法 求解 最 优 控 制 问 题 . 本 节 将 讨论 末端 时 
刻 固 定 和 末端 时 刻 自由 时 ,最 优 解 的 必要 条 件 与 充分 条 件 。 


2.4.1 可 用 变 分 法 求解 的 最 优 控制 问题 
设 控 制 系 统 的 状态 方程 为 下 列 时 变 非 线性 向 量 微分 方程 ; 


X(t)= flxG) ,uC),t] (2-65) 
初始 条 件 
x(to)=x(0) (2-66) 
式 中 x(2) 为 nn 维 状态 问 量 ,wu(i) 为 m 维 控制 向 量 。 
性 能 沁 困 取 为 
JJ 一 0 [ed 站] 十 | Lert)dt (2-67) 


式 中 控制 向 量 w(i) 不 受 约束 , 且 在 [io,iyj] 区 间 上 连续 ;末端 时 刻 tj 可 以 固定 ,也 可 以 自由 ; 
木 疾 状态 x (ty) 或 固定 或 自由 或 受 约束 ;在 时 间 区 间 [to。,t/J 上 ,标量 函数 gC(。) 和 LC(。) 连 
。D8 。 


续 且 二 次 可 微 , 向 量 陋 数 F(，) 连 续 且 可 微 。 
设 要 求 的 自 标 集 为 
gxGtr)tr 一 0 (2-68) 
式 中 yg €E R',r 二 nn。 则 最 优 控 制 问题 是 ;寻求 最 优 解 x* (0 和 2 (4) ,使 系统 (2-65) 从 已 知 初 
态 (2-66) 转 移 到 要 求 的 目标 集 (2-68) ,并 使 给 定 的 性 能 泛 函 (2-67) 达 到 极 值 。 
如 果 系 统 的 最 优 控 制 问 题 比较 简单 , 则 可 以 直接 应 用 前 面 各 节 给 出 的 结果 求解 .试看 
下 例 。 
例 2-6 设 一 阶 系统 方程 为 
T=—z0)+ult), xX(0)=3 
要 求 确定 最 优 控制 函数 zx” (及 最 优 轨 线 x* 4), 在 1=2 时 将 系统 转移 到 z(2) 一 0, 并 使 
下 列 性 能 泛 也 极 小 : 
1=| Qu dt 


解 ”者 从 系统 方程 中 解 出 (2), 即 
u(t)=i(t) txt) 


将 其 代入 性 能 泛 阴 ,得 
J=| Qtz+2rzt ze)dt 


于 是 ,性 能 泛 函 中 只 含 一 个 宗 量 xz(:)。 这 样 , 便 可 以 直接 应 用 前 面 几 节 的 结论 。 
本 例 属于 末端 时 刻 固定 、 初 态 和 末 态 两 端 固定 .积分 型 性 能 泛 函 的 变 分 问题 。 今 
志 (Cz 天) 一 工 十 大 十 2 和 芷 十 并 
由 泛 函 极 值 的 必要 条 件 , 欧 拉 方程 为 
oaL dd aL 


ax di ax 7 TT 


解 得 
ZE) 一 Ce 十 Ce 一 
式 中 c 和 cs 为 待定 常数 。 根 据 横 截 条 件 
ZL0) 一 3， Z(2) 一 0 
求 出 
c=3(l~e’) '*, 6c,=3(]—e™‘)-! 
于 是 ,使 给 定性 能 泛 函 取 极 值 的 最 优 解 为 


or (0) = oie 
£0) — te + 
再 由 无 约 东 泛 函 极 小 值 的 充分 条 件 (2-35) 得 
; 
nt 
2 2>0 


故 所 求 得 的 x (4) 可 使 性 能 泛 函 取 极 小 值 。 


e JO" 


一 般 来 说 ,从 系统 约束 方程 中 解 出 &() 并 非 易 事 。 知 再 考虑 到 目标 集约 束 条 件 以 及 
性 能 泛 函 为 复合 型 的 情况 , 例 2-6 的 方法 就 失去 了 一 般 性 。 因 此 ,对 于 一 般 的 最 优 控 制 问 
题 ,应 广泛 采用 拉 格 朗 日 滋 子 法 , 引 和 人 哈密 顿 郴 数 概念 ,将 省 郴 条 件 极 值 问 题 转化 为 无 约 
束 泛 晒 极 值 问 题 , 以 获得 最 优 解 的 必要 条 件 和 充分 条 件 。 
2. 4.2 末端 时 刻 固 定时 的 最 优 解 

当 z 固 定时 ,以 式 (2-65) 一 式 (2-68) 表 达 的 最 优 控制 问题 可 以 归纳 为 如 下 一 般 形 式 : 

min/=? [zc 站 十 | Le ;Ut dt 
St fxuUst)—X()—=0, x(to) ~—xo 
plxC) |=0 

假设 各 向 量 维 数 关 系 同 前 ,末端 状态 x(ij) 或 受 约束 、 或 自由 、 或 固定 ,此 时 ,最 优 控 制 问题 
的 实质 是 有 两 个 等 式 约 束 的 泛 函 条 件 极 值 问题 。 

为 了 把 泛 函 条 件 极 值 问题 转化 为 无 条 件 泛 函 极 值 问题 ,引入 两 个 拉 格 朗 日 乘 子 向 量 : 


ACEGR 和 7 (4)E€ R’。 构造 如 下 广义 泛 函 : 
Js—=9 x(t) 7 (gg Lx(t)] 


十 | {L(x :十 人 CELL Cru,t)—x() |} dt (2-69) 


从 变 分 观点 来 看 ,J 与 7 是 等 价 的 ,因此 确定 了 广义 泛 函 J 的 无 条 件 极 值 ,也 就 确 
定 了 沁 函 J 的 条 件 极 值 。 为 了 便于 求解 ,定义 如 下 哈密 顿 孙 数 : 
HxyusA st)—Lr ut) HAT CR) (2-70) 
将 式 (2-70) 代 人 式 (2-69) ,得 


Jo=9 [x Ce)IH7T DY [rn) It| CH Gd 1 —AT Ce) Jdt 

因为 上 式 中 最 后 一 个 积分 项 的 分 部 积分 为 

-| Arr)d= 一 TCDxzC) 人 | 和 CDx(t)dt 
所 以 三 义 泛 薄 可 表示 成 如 下 形式 : 

Jo=9p Lx) HY Og LxCG)]—AT Gr) + AT Gxt) 

二 | LH Gua +A Cr) dt (2-71) 
对 却 (2-71) 取 一 次 变 分 ,注意 到 待定 乘 子 向 量 1 (1) 和 7 (2) 不 变 分 ,以 及 6x(t。) 二 0, 可 得 
9 十 去 一 一 一 9 乡 一 一 一 -7Y (tr) 一 1 


9x(tr) QOx(ltr ) 
T 
< jd (2-72) 


(7 
+|[[ 综 + 外 sz+| 3 
根据 沁 函 极 值 的 必要 条 件 , 令 式 (2-72) 为 零 ,考虑 到 宗 量变 分 5x (2)、6u(z) 和 6x(y) 的 任 
意 性 ,得 广义 泛 函 取 极 值 的 必要 条 件 
aH 


欧 拉 方程 4 (一 一 一 (2-73) 


。30 。 


0J,=6xT (7) | 元 


9H (2-74) 


ou 
工 
横 截 条 件 A GD ta (£7) (2~75) 
引进 哈密 顿 标量 函数 (2-70) 后 ,使 得 极 值 必要 条 件 中 的 如 下 两 个 方程 具有 正则 形式 ， 
E(t) = fut) (2-76) 
4 CO 一 一 < (2-77) 


它们 的 右 疹 都 是 哈密 顿 亢 数 的 适当 偶 导 数 , 故 称 为 正则 方程 。 其 中 , 式 (2-76) 是 众所周知 
的 状态 方程 ; 式 (2-77) 称 为 协 态 方程 或 共 斩 方程 ,相应 的 乘 子 向 量 1 ( 轧 则 称 为 协 态 向 量 或 
共 扳 向 量 。 正 则 方程 (2-76) 和 (2-77) 是 22 个 一 阶 微 分 方程 组 。 初 始 条 件 (2-66) 和 横 截 条 
件 (2-75) 正 好 为 正则 方程 提供 了 2x 个 边界 条 件 。 根 据 对 LC(。)、pg(，。) 和 fC(，) 的 连续 性 
与 可 微 性 假设 ,正则 方程 可 以 唯一 确定 状态 x(t) 和 协 态 4 (2)。 

对 于 确定 的 x(z) 和 4 (7) ,哈密 顿 函数 石 是 u(t) 的 函数 。 必 要 条 件 (2-74) 表 明 , 极 值 控 
制 u* (2) 使 哈密 顿 清 数 太 取 驻 值 。 因 此 , 式 (2-74) 通 常 称 为 极 值 条 件 或 控制 方程 。 
式 (2-74) 为 m 次 代数 方程 ,可 以 确定 极 值 控 制 w* (4) 与 极 值 轨 线 x* (ti) 、 协 态 向 量 1 (之 
间 的 关系 。 / 

应 当 指 出 ,正则 方程 (2-76)、《2-77) 通 过 极 值 条 件 (2-74) 成 为 变量 互相 耦合 的 方程 。 
其 边界 条 件 中 的 一 部 分 是 初始 条 件 , 另 一 部 分 为 末端 条 件 。 因 此 , 求 最 优 控制 归纳 为 解 微 
分 方程 两 点 边 值 问题 。 在 多 数 情况 下 , 需 采 用 数字 计算 机 求 其 数值 解 。 

在 求 最 优 解 过 程 中 ,经 常 使 用 哈密 顿 函 数 的 下 列 性 质 : 取 哈 密 顿 函数 对 时 间 的 全 导 
数 ,得 


dH 19 五 1 3 五 1 aH\! aH 
< | zGD) 十 | 3 CD 十 | 3 1 CD) 十 < (2-78) 
在 最 优 轨 线 (x 一 x* ,wu 一 nw* ,A = 二 A 上 ,有 
,9H oF ___39Hn 
TA’ du ”ax 
于 是 , 式 (2-78) 可 写 为 
dH 2H 
了 二 本 (2-79) 
或 
H(i)~=H()— dr (2-80) 


右 哈 密 顿 昂 数 不 显 含 上 , 则 有 
H(t)=const, EListr |] 
因此 ,哈密 顿 函 数 的 性 质 是 : 沿 最 优 轨 线 , 妃 对 时 间 的 全 导数 与 对 时 间 的 偏 导 数 相 等 ; 当 
玉 不 显 含 1 时 , 态 沿 最 优 轨 线 保持 为 常数 。 
在 以 上 讨论 过 程 中 ,主要 针对 末端 受 约束 的 情况 。 若 末端 自由 , 则 上 述 结 果 中 不 出 现 
YLx(4y)j; 奋 末端 固定 , 则 因 6x (zj) 二 0, 上述 结 果 中 , 横 截 条 件 (2-75) 不 存在 。 因 而 ,在 各 


种 末 态 条 件 下 ,可 将 上 述 结果 归纳 为 如 下 定理 。 
。31 。 


(1) 末端 时 刻 固定 时 最 优 解 的 必要 条 件 
1) 末端 受 约束 情况 。 
定理 2-10 对 于 如 下 最 优 控 制 问 题 


minJ = [x(/)] 十 | L(xoust)dt， 4 固定 
utr) to 


S.t. X(t)= fxut), X(to)=Xo 


slx(t)|=0 
最 优 解 的 必要 条 件 是 (为 便于 书写 ,今后 几 不 致 混 消 之 处 , 均 省 略 “x 
QD x(2) 和 A (4) 满足 下 列 正则 方程 ， 
3 五 
X(t) = 二 
A (一 一 2 和 
式 中 
五 (xy At 一 EX tA (4) fx,u ,t) 
边界 条 件 
X(to) = xo 
Cr 一 -22 二 -2 乡 7y( 
/ FI ) ax) “7? 
ylxl) |=0 
(3) 极 值 条 件 
aH 
5 一 (0 
2) 末 站 目 由 情况 。 


定理 2-11 对 于 如 下 最 优 控制 问题 : 
minv 一 9 [xd 站 十 | Lorn pd 


s.t. ZX) 一 大 (xzeti)， rlto)—= ro 


式 中 ,tj 固定 ,x(4y) 自 由 。 最 优 解 的 必要 条 件 为 ， 


GD x(t) 和 4 (z) 满 足下 列 正 则 方程 : 
#4) = 
A (= 一 
式 中 
H(xsusA ,t)—=L(x ut) A (Gt) fF x,nu,t) 
边界 条 件 
X (to) = xo 
A (17) 一 FS ) 
@) 极 值 条 件 


* 37 4 


”号 ) ， 


7 


5 二 0 


3) 末端 固定 情况 。 
当 末 端 国 定 , 即 x(Gr) 一 xr 时 ,性 能 泛 晒 中 的 末 值 项 已 无 存在 的 必要 。 由 于 6x(to)= 二 0 


和 6x(i/) 二 0, 广 闵 泛 函 J 的 一 次 变 分 (2-72) 变 为 
yiaH i 
3 一 | [| 名 +4 


令 式 (2-81) 为 零 ,考虑 到 fx 是 任意 的 , 故 仍 有 协 态 方程 


T 
Bx+ | 2 Gu [dt (2-81) 


成 立 。 应 特别 注意 的 是 :对 协 态 方程 而 言 ,不 再 存在 如 式 (2-75) 那 样 的 横 截 条 件 ,也 不 能 理 
解 为 人 (tr) 一 0。 因 为 Sx(r) 一 0, 所 以 为 满足 SJ =0, Ar) 一 0 不 是 必要 的 ,也 不 能 成 立 。 此 
时 ,已 知 的 x(io)= 二 xo 和 和 x(ty)= 二 xj, 就 是 正则 方程 的 两 端 边界 条 件 。 此 外 ,为 满足 6x (zy) 二 
0, 容许 控制 变 分 6u(2) 已 不 再 是 完全 任意 的 ,必须 满足 某 些 限 制 条 件 。 事 实 上 ,出 状态 方 
程 的 变 分 


Bx(#) =2 x(t) + uC) (2-82) 
可 解 得 
f 9af 
x(t)=® Coarco) 十 | ® (fs) Shouls)ds (2-83) 
式 中 人 多 (t,to) 是 微分 方程 (2-82) 的 状态 转移 和 矩阵。 在 式 (2-83) 中 , 令 一己 , 考 虑 到 Sx(i) 一 
0, 故 有 
x(t/) = | IG (5) fou Cs)ds (2_84) 
显然 ,为 满足 SGx( 人 rr) 一 0, 容 许 控制 变 分 Gu () 应 满足 如 下 限制 条 件 : 
| (isS) 3 二 ou(s)ds 一 0 (2-85) 


因此 ,不 能 简单 地 应 用 变 分 原理 2-5 导出 9 五 /934 二 0 的 极 值 条 件 . 但 是 ,卡尔 曼 曾 经 推 证 ， 
各 被 控 系 统 完全 可 控 ,同样 可 以 导出 39 如 /3u==0 的 极 值 条 件 。 
定理 2-12 对 于 如 下 最 优 控制 问题 


1 
. f 
min = 一 | L(x,uwu,t)dt 
Wer) to 


S.t. T(t) = f(x,u,t), X(to) = xo 


式 中 ty 固定 ,x(ty) 二 x/。 阁 系统 完全 可 控 , 则 最 优 解 的 必要 条 件 为 ; 


QD x(t) 和 A () 满 足下 列 正 则 方程 : 
(一 2 人 
££) = 
aH 
A (= 一 
式 中 


H(x,u,A ;t=LX WA (Gf xu ,i) 
。33 。 


@ 边界 条 件 
X(to) = Xo 
X(t/)—=xr 
@@) 极 值 条 件 


aH 


au™! 


例 2-7 设 一 阶 系统 方程 为 
ZH)=u(t), Xr(to) = ro 
性 能 指标 取 为 
J = 二 cr (7) A God | 
式 中 常数 c 盖 0, 和 4 给 定 ,z(ty) 自 由 。 试 求 使 了 取 极 小 值 的 最 优 控制 wx* (2) 和 相应 的 性 


能 指标 7"。 
解 ”本题 为 复合 型 性 能 指标 . 姑 固定 .末端 自由 问题 。 由 题 意 


f=u, L(. ) 一 可 ze， op( 。 ) 一方 cz2 人 by) 


构造 
H(zstshy) = 二 


根据 定理 2-11 ,最 优 解 必要 条 件 为 
. aH 


Z 1 8， zx(to) 一 0 


1) 一 9 号 0， At) 一 const 
ox 

9 _ A=0, u(t)=—A0) 

ou 


gg _ 
Alty) 一 5 一 CCtr) 


于 是 
A(1)=A(ty)=crlty) 
u(t)=—cr(ty) 
从 而 
二 —cx(ty) 
解 得 


X(t)= -| cr(ltr)dt=—= xo~cr(ty) (tC—to) 


在 上 式 中 , 令 1 二 ty, 得 
全 


rx (= TF) 
故 最 优 解 为 


CTo 


u (1) = TF Te) 


。 34。 


Cg 
1 十 ct 一 如) 
cxo 


2 1+c(ty—to) 
由 于 哈密 顿 丽 数 互 不 显 含 纪 , 故 沿 最 优 轨 线 
H* (一 二 zx 十 和 ae 


人 4”(t) 一 


J (2) 二 土 


= 3 TTT nT 
由 此 可 见 , 当 妃 固定 时 ,哈密 顿 函数 的 性 质 可 作为 一 个 验算 条 件 。 此 外 ,由 于 问题 有 解 , 且 
由 必要 条 件 所 得 的 极 值 控制 是 唯一 的 ,所 以 wx* (2) 就 是 最 优 控制 。 
例 2-8 试 求 使 被 控 系 统 


—const 


Tz1(t) = z(t) 
zt,(t)=u(t) 
由 已 知 初 态 x1(0) 二 0 和 zz(0) 一 0 出 发 ,在 ty 二 1 时 转移 到 目标 集 
Zi(1) 十 zz(1) 一 1 
且 使 性 能 指标 


一 了 | wd 


为 最 小 的 最 优 控制 x* (z) 及 相应 的 最 优 轨 迹 x* (2)。 
解 ” 本 题 是 积分 型 性 能 指标 .ty 固 定 、 未 端 受 约束 的 问题 。 由 题 意 
PLx(tr) 一 0， fiC*)=zx(t), fal * )=ult) 


[Lx Jr) +r) —1, LO )=5u Ct) 
根据 定理 2-10, 正 则 方程 


XZ1(t)= x,(t), z(t) =wu(t) 


和 人) 一 一 2 生 一 0， 恩 (一 一 2 生 一 一 和 人) 
1 2 
式 中 
H= 3 +hrt hu 
边界 条 件 
XxX1(0)=0,， TXT.(0)=0 
9 _ 90 ~y_ 
A(l1)= 5 5 一 7 ， 4 人 1) 一 5zGTJ7 一? 
7X1(1) 十 xX,(1)= 二 1 
极 值 条 件 
Sut 二 0 
由 协 态 方程 及 极 值 条 件 ,得 
A (1) 一 Ci 


De 


At) 一 一 CE 十 cs， 
UL(t 一 CI 一 C2 


于 是 ,状态 方程 的 解 为 


TX1(t) 一 Eat 一 Heat? tcsttc 


1 
TX» (t) ——cit’—cstices 


2 
式 中 cy,i1 二 1,2,3,4 为 待定 常数 。 
由 已 知 初 态 , 求 出 
cs 二 C4 二 0 
再 由 目标 集 条 件 求 得 
4c1 一 9cy 一 6 
最 后 ,由 模 截 条 件 
得 到 
1 
1 7 2 
于 是 解 出 
3 6 
CT， (2 7 
本 例 的 最 优 解 为 
w* (W) 二 一 六 (一 2) 
/A 1,,3, 
村] (tf) 一 Ia 十 7 
zi (1D) =— +t 
AY (一 一 六 


+ (f= 
Mi (划一 了 了 (一 2) 


rr 了 
7 ” (ti) 一 7 


(2) 末 端 时 刻 固 定时 最 优 解 的 充分 条 件 

如 果 要 求 广 义 泛 函 J, 取 极 小 值 , 则 由 定理 2-4 知 , 广 义 泛 孙 J 沿 最 优 轨 线 的 二 次 变 
分 必须 为 正 。 下 面 的 定理 给 出 了 末端 受 约束 时 最 优 解 的 充分 条 件 。 

定理 2-13 对 于 如 下 最 优 控制 问题 : 


minv 一 9 [rd 站 十 | Los + st) dt 


st X= ut), x(to)=xo 
四 46 本 


jlx(ts) |=0 
式 中 固定。 使 性 能 泛 函 7 取 极 小 值 的 最 优 解 的 充分 条 件 是 下 列 等 价 勒 让 德 条 件 之 一 
成 立 : 


oa:H a*H 
2 x duadrx 9:@[ rx),7 | 
(WD) jt jp 0 me) 之 0 (2-86) 
QuUdx DB 
9 歼 9 :HH 
z Ox’ QAUdx alx(t;),Y | 
©) ji T 2 二 0， Taray) 0 (2-87) 
duUdx au’ 
式 中 
H(xyu,A ,1)—=L(x rt) 十 人 《有 FE) (2-88) 
OL x ,7 J]=9 [xr) 7Y (Cy Lx())] (2-89) 


证 明 ” 当 式 (2-88) 及 式 (2-89) 成 立时 ,广义 泛 函 表达 式 为 
J 一 @Lx (tr) ,7 ] 十 | ‘THe, ,tt)—A GX) Id 


取 上 式 的 二 次 变 分 ,得 


9H 92H 
, . ox a9u9dx|fox 
9", 一 让 0x (1/) 3 Ox Ci) 十 3) ex] ps op La 
duax Qu 


当 条 件 (2-86) 或 (2-87) 之 一 成 立时 , 必 有 宙 J.>0。 由 定理 2-4 知 , 沿 最 优 轨 线 J 取 极 小 
值 ,从 而 J 取 极 小 值 。 
如 果 末 端 目 由 ,上 述 定 理 的 结论 仍然 适用 ,只 是 式 (2-89) 应 改写 为 
@LxGtr 王 PLD) (2-90) 
应 当 指出 ,只 要 最 优 控制 问题 有 解 , 且 由 必要 条 件 所 得 到 的 最 优 解 是 唯一 的 , 则 对 物 
理 系 统 而 言 , 充 分 条 件 往 往 成 立 。 


2. 4. 3 未 端 时 刻 自由 时 的 最 优 解 


当 末 端 时 刻 尹 自由 时 ,末端 状态 又 可 区 分 为 受 约束 .自由 或 固定 三 种 情况 。 这 里 以 末 
端 受 约束 情况 进行 一 般 讨 论 , 所 得 到 的 结果 可 以 方便 地 推广 到 末端 自由 和 末端 固定 情况 。 
末 病 时 刻 且 由 时 所 讨论 的 问题 , 除 尹 自由 外 ,其 余 与 末端 时 刻 固 定时 所 讨论 的 问题 相同 。 

对 于 复合 型 性 能 指标 ,在 状态 方程 和 自 标 集 两 个 等 式 约束 条 件 下 , 引 人 和 人 拉 格 朗 日 乘 子 
At 和 7 (2) ,构造 如 下 广义 泛 郴 : 


J=9p [xG) ,ttY (0y [x GD) t+) TH Os DAT EO) dt (2-91) 
式 中 态 (x,u,4 ,t) 为 哈密 顿 明 数 ,定义 式 同 式 (2-70)。 
当 末 端 由 《xy,iy) 位 置 移动 到 《xj 十 6xjy,tjy 十 6ty) 位 置 时 (参见 图 2-3) ,产生 如 下 广义 泛 
曙 增 量 : 
。37 。 


AJj .一 0 | (tr) 十 Gxrotr 十 BCt| 一 0 | x” (#7) ,ty 
YTO) {yp x’ Gr) ore ts tot ly Lx’ Cy) ,tr} 


+| {HO +6xsu’ Ou,A ,2 —AT LE (2) +Or]}dt 
‘f 


+| er Oru” FOuAst) HC yu’ A) AT Oz (2-92) 


对 式 (2-92) 取 一 次 变 分 ,并 应 用 积分 中 值 定理 和 分 部 积分 ,以 及 考虑 到 SGx (io) 一 0, 得 到 三 
义 泛 阻 的 一 次 变 分 表达 式 


_fT_p 了 a 
81. = | 元 人 OX/ 十 Ot 


» 工 
role 5x 十 8tr| 十 (本 一 一 Mr) | 8 


2 9 五 {19H 
+] [二 + 
由 式 (2-46) 知 ,如 下 关系 式 成 立 : 
Ox(t/)=6Ox/— X(t)6ty (2-94) 
将 式 (2-94) 代 入 式 (2-93), 整 理 得 


_[9o9 T ag 9 ag 
57,=| 5E+7 GFE THD lat | gst + jY C27) Adan] Bx 


ou dt— [LAT (6x]|, (2-93) 


+| 4 Bl Su dt (2-95) 
令 式 (2-95) 为 零 , 可 得 各 种 末端 状态 情况 下 最 优 解 的 必要 条 件 。 应 当 指 出 : 

当 末 端 受 约束 时, 式 (2-95) 中 各 微 变量 6ty,6xy,6x,6u 均 是 任意 的 , 且 不 为 零 ; 

当 末 端 自 由 时 , 式 (2-95) 中 各 微 变 量 6ty,6xy,6x,6u 也 都 是 任意 的 ,但 式 中 不 出 现 有 
关 y Lx (ty) ,tj 项 ; 

当 末 端 固定 时 ,在 式 (2-95) 中 , 微 变量 6tr 和 6x 任意 ,Ou 应 满足 式 (2- 85) 条 件 限制 ， 
而 65x27) 一 0,6x/ 一 0, 且 式 中 不 出 现 有 关 y Lx(ty) ,tyj 的 项 ,其 极 值 条 件 9 及 /34= 二 0 的 获 
取 ,要求 被 控 系 统 完全 可 控 。 

(1) 末端 受 约束 时 最 优 解 的 必要 条 件 

定理 2-14 对 于 如 下 最 优 控制 问题 : 


minJ =9 [x (4)) t+| Lr, td 


Ss.t. X(t)= f(r,u,1), X(to) = Xo 
z J Lxlt),tr =0 
式 趴 自由。 最 优 解 的 必要 条 件 为 : 
CD x(t) 和 4 (2) 满足 下 列 正 则 方程 : 


(4) 一 上 


A (= 一 


式 中 
H(xsusaAd ,tt)—=L(x ut) A (fru,t) 
。38 。 


Go 边界 条 件 


X(to) = xXo 
99 og 
4 47) 一 5 十 3 “7) 
y [x (ty) tr] 一 0 
(3) 极 值 条 件 
aH 
gu 
由 哈密 顿 郴 数 在 最 优 轨 线 末端 满足 
HED = -7 


(2) 末端 自由 时 最 优 解 的 必要 条 件 
定理 2-15 ”对 于 如 下 最 优 控制 问题 : 


minv 一 9 [LxGtr) +) Ze ,Lt) di 


Ss.t. X(t)= f(x,u,t), X(to) =xo 


起 中 性 自由 ,x(ty) 自 由 。 最 优 解 的 必要 条 件 为 : 


CD x(t) 和 A (2) 满 足下 列 正则 方程 ; 
aH 
Xf) = 
A (= 一 
式 中 
H(x,u ,及 ;tt) =LOx Ut) A (fx Et) 
@ 边界 条 件 
X(to) =xo 
A (ty/)= jx ) 
@) 极 值 条 件 
aH 
一 人 
4) 哈密 顿 隆 数 在 最 优 轨 线 末端 满足 
Fn 一 一 于 


(3) 末端 固定 时 最 优 解 的 必要 条 件 
定理 2-16 对 于 如 下 最 优 控制 问题 ， 


minv 一 9 [x (ty) t+ | Lert)dt 


St， X(t)= f(x,u,t), x(t0)=x, 
式 中 心目 由 ,*(Gr) 一 xzr。 若 系统 完全 可 控 , 则 最 优 解 的 必要 条 件 为 ， 
CD xD 和 AD) 满 足下 列 正则 方程 : 


e 39 。 


A (= 一 
式 中 
HlxsusA ,st)—=L x ui) tA Cf x,u,t) 
@ 边界 条 件 
X(to) =xXo 
PACTDEE 
(3) 极 从 条件 
aH 
5 一 (0 
@ 哈密 顿 函 数 在 最 优 轨 线 末 闪 满 足 
HGdD= 一 证 
例 2-9 设 一 阶 系统 方程 为 
z(t)=u(t) 


性 能 指标 取 为 
J=ty 二 记 | wdi 


式 中 i 自由 。 试 确定 最 优 控制 w* (2) ,使 系统 由 xz(0) 二 1 转移 到 z(ty)==0, 并 使 性 能 指标 
为 极 小 值 。 

解 ” 本 题 为 复合 型 性 能 指标 .tj 自由 、 末 端 固定 ,控制 变量 取 值 无 约束 的 最 优化 问题 ， 
可 用 变 分 法 求解 。 

根据 定理 2-16, 令 哈密 顿 函 数 


H= 5th 

由 协 态 方程 

1 一 一 2 一 0， A(t)=a=const 
由 极 值 条 件 

utA=0, xD 一 一 MD 一 一 4 
由 状态 方程 及 初 态 条 件 z 

1)=ult)=—a, T(t)=1—at 
由 末 态 条 件 


Zr 一 1 一 Qtr 一 0， ao 一 下 
由 哈密 顿 函 数 在 最 优 轨 线 末 端 应 满足 的 条 件 
HOD)= Fu +A ut) = -于 = 一 
。40 。 


Bh 


Fa 一 a= 一] 
解 得 
a=V2 
于 是 最 优 解 为 
u* (t)=— V2,， j= 


z(t)=1~—~ V2t, AG=vV2 
1 = + dt= VD 
例 2-10 设 一 稻 轮 船 驶 经 一 强 水 流 区 域 。 水 流 方向 是 已 知 的 位 置 阻 数 
VY 
UUu(Tt,y) = 


一 (zyy) 一 0 
式 中 工 和 yy 为 直角 坐标 ;u 和 vv 分别 是 水 流 在 z 和 方向 的 速度 分 量 ;V 是 轮船 相对 水 的 
速度 ,为 一 常数 ;h 为 但 值 。 试问 怎样 驾驶 轮船 ,使 船 以 最 短 时 间 从 起 点 (zo/h==3. 66,yo/h 
一 一 ]. 86) 驶 至 终点 (zj/h= 二 0, ys/h 二 0)? 
解 ” 轮 船 的 运动 方程 为 
t=Vcos0+u 
y=—=Vsing 
式 中 2 为 轮机 驾驶 方向 与 zx 轴 之 闻 的 航向 角 ,为 控制 变量 ,其 值 不 受 约束 。 
由 题 意 ,性 能 指标 取 为 


J=| ‘d= (ft1—to) 


本 题 属于 积分 型 性 能 指标 ,tj 自由 ,末端 固定 ,控制 量 取 值 无 约束 的 变 分 问题 。 由 定 
理 2-16, 令 了 哈密 顿 肾 数 


如 二 1 十 AV cos0 一 六 | 二 A,Vsing 

由 协 态 方程 

太一 一 2 名 =0， A=a=const 

dz 
—__9H_V bY 

A, 3y hz， A= Fattb 

式 中 a 和 2 为 待定 般 数 。 
由 极 值 条 件 
5 一 一 人 Vsin6 十 A,Vcos9 二 0 


ed 。 


由 哈密 顿 函 数 性 质 及 其 在 最 优 轨 线 末 端 应 满足 的 条 件 
HG)=H(t)=0 


取 H(ty) 二 0, 有 
1 二 AV cos01— | 十 人 tangryYsingr 一 0 
解 得 
”cosWr _ singy 
As V ? ,一 V 
取 玉 () 一 0, 有 
一 一 Acost A= hsing 
* VC(h—ycos0)” ，” YY(R 一 ycos0) 
因为 为 常数 , 改 有 
hcosg cos 
V(h—ycos0) V 
解 得 


~—sec0— secOy 


9 一 — cos’0 
积分 上 式 ,得 
(t1—t)=—tan0ttangy 
于 是 由 状态 方程 解 得 
2 ——h(sec0+secO/+sec0— sec:0,) 
积分 上 式 , 得 
x 


Eu 
Ce 


万 二 了 | 一 secbr(tangy 一 tang) 二 tang(Csecbr 一 secb) 一 In ee 


tang 十 seclO 
设 初 始 航 问 角 为 0,, 代 入 已 知 初 值 zo/h= 二 3. 66 和 yo/ 站 三 一 1.86, 解 得 


0, = 105°, 


Gr= 240° 


图 2-6 最 短 时 间 轨 线 
. 42 本 


于 是 ,从 起 点 (3. 66 ,一 1. 80) 至 终点 (0,0) 所 需 最 短 时 间 为 
h 
t:—to= 0. 46 Vy 
最 优 航线 如 图 2-6 所 未 。 


2.5 角 点 条 件 与 内 点 约束 


用 变 分 法 求解 最 优 控制 问题 ,要求 容 许 轨 线 x(z) 连 续 可 微 。 但 是 ,实际 上 稍 有 Yi) 为 
分 段 光 滑 情 况 , 即 x(i 在 有 限 个 点 上 连续 但 不 可 微 。 这 种 连续 而 不 可 微 的 点 称 为 角 点 。 本 
节 将 研究 在 最 优 解 的 必要 条 件 中 , 角 点 及 内 点 应 满足 的 条 件 。 


2. 5.1 维尔 斯 特 拉 斯 - 欧 特 受 条 件 
设 x (2) 分 段 光滑 ,和 且 是 使 下 列 性 能 泛 陋 : 
T=| Ler, dd : (2-96) 


了 到 极 值 的 极 值 轨 线 ,在 zx" (2) 为 标量 情况 下 ,如 图 2-7 
所 示 。 

假定 在 [to,tyj 区 间 中 ,x* (4) 只 在 有 一 个 角 
点 ,未 知 ,to 及 设 为 固定 。 在 图 2-7 中 ,x(z) 为 任 


x(t)=x" (t)+ox(t) (2-97) 
由 于 在 1 二 4 处 不 可 微 , 故 式 (2-96) 可 以 写 为 i 
2-7 
式 中 
一 上 | L(xsX,t)dt (2-99) 
太一 | L(t)dt (2-100) 


显然 ,J 对 应 自由 末端 时 刻 ,J 对 应 自由 初始 时 刻 。 
由 2.3 节 知 , 记 了 欧 J 的 一 次 变 分 为 


11D37 d aL\! aLi! 
3 = | 完 一 吉 和 | xd 十 [| 计 jz | 


二 L(x" 区 | 66 (2-101) 
由 图 2-7 可 见 
Gx (ii  ) 一 GY 一 工 (1 06, 《2-102 ) 
将 式 (2-102) 代 和 人 式 (2-101) ,得 
2 T 
57.=| aL daL :| 


ax dt 3 
类 似 地 ,由 2.3 节 初始 时 刻 自 由 、 末 问 固 定 、 起 点 自由 的 情况 ,可 得 泛 汕 J, 的 一 次 


* 139 


T 
_Oxi 十 -| 9L 


T aL 
rd: 十 | 5 


0 (2-103) 


变 分 


aL do9aL aL 


3 二 | | 守 一 王 | jxd; 一 | 纯 | 6 十 [一 | 写 | x*|| ,54 (2-104) 
由 式 (2-103) 和 式 (2-104) 得 泛 果 (2-98) 的 一 次 变 分 为 
{gL dd aL 3 也 | 3 志 
57/=| | 充 一 总 于 | 3xdt+t | | pe 二 -| 于 | + ex 
+| | xT oe | -+[ 7 一 xt! | ,en (2-105 ) 
令 式 (2-105) 为 零 ,得 有 和 角 点 泛 范 (2-98) 取 极 值 的 必要 条 件 为 
Qa 欧 拉 方 程 
5 一 人 LO, re [ss] (2-106) 
@) 角 点 条 件 
9 aL 
7| = + (2-107) 
2 一半 | 7 =| Lx# | i (2-108) 
角 点 条 件 常 称 为 维尔 斯 特 拉 斯 - 欧 特 曼 条 件 。 
2.5.2 内 点 约束 条 件 
状态 轨 线 的 中 间 点 称 为 内 点 。 和 若 存 在 一 组 内 点 约束 条 件 
HLxCGi) |=0 (2-109) 
式 中 之 i 过 tj, 为 某 一 中 间 时 刻 ;z(。) 为 gc 维 向 量 函 数 、 则 泛 函 极 值 的 必要 条 件 有 所 
设 妖 因 定 .未 喘 自 由 ,存在 内 点 约束 的 复合 型 性 能 泛 本 的 变 分 问题 为 
问题 2-3 minJ 一 9 [xC)]+ | 工 Gevas2d: 


s.t. 站 一 (at)， (to) 一 X0 
PLXx( 人 (一 0 
式 中 固定 ,x(iy) 自 由 ,ti 自由 ,x(t1) 自 由 。 要 求 确定 性 能 泛 聘 极 值 的 必要 条 件 。 
当 和 存在 内 点 约束 条 件 时 ,x() 在 时 未 必 可 微 。 可 以 zi 为 界 ,将 7 了 分 成 两 部 分 


= [zcnD] 二 | Lermaet| L(x,u,t)dt 


可 以 认为 ;内 点 约束 条 件 (2-109) 是 到 二 那 部 分 轨 线 的 一 组 末端 约束 条 件 。 引 和 人 待定 乘 
子 回 量 人 (ER 和 x (12) € R*, 将 同时 考虑 状态 方程 约 东 和 内 点 约束 的 条 件 泛 函 转化 为 无 
条 件 泛 函 极 值 问 题 。 构 造 如 下 广义 泛 孙 : 


J .一 0 [zcD] 十 | (H—A'x)dti+rx'in[xC) 十 | (HH—A'xX)dt (2-110) 


式 中 太 和 厂 都 是 可 变 的 ,哈密 顿 函 数 
H(xsusA ,t=—=LX uA GF ru,t) 
。44 。 


在 式 (2-110) 中 ,等 式 右 端 前 两 项 属于 初始 时 刻 自由 的 泛 函 ,后 两 项 属于 末端 时 刻 自 


由 的 泛 了 沙 。 因 此 ,广义 泛 孙 的 一 次 变 分 为 
+60t1— (A'Ox) 


上 


T 
OXr 一 (HDH—A'xX) 


[199 
5. 一 | x | 


+| "| aH 


A r+ 名 
du 
anx'n 


T 
5 su jd 
dx(t,) 


+ STH Sr + TT ot +(H—A'x)|, — 


— CATOx) + | 5 二 和 az+| 完 
在 式 (2-111) 中 ,代入 如 下 关系 式 : 


Ox1=Ox(ti TXT Ot C=OxCG Hi or 


经 整理 后 ,得 


37.=| [| + x+| 名 9 Gu det | 3 


Ax(ty) 


+ [2 CG) A Gr ) + | Gmt [HGH ) te ge | 


i 


—A coal bx/ 


(2-111) 


(2-112) 


令 式 (2-112) 为 等 ,考虑 到 微 变 量 6x,6u,6xj,6x 和 64, 均 是 任意 的 , 故 立 即 可 得 泛 函 


极 值 的 必要 条 件 , 见 如 下 定理 。 
定理 2-17 对 于 问题 2-3, 最 优 解 的 必要 条 件 为 


CU x(t) 和 4 (1) 满足 下 列 正则 方程 ，; 
(一 2 全 
aH 
A (站 一 一 5 
式 中 


再 (YA ,tt)=L(x mut) A (fx mt) 
(2) 横 截 条 件 与 边界 条 件 


Xlfto) = xo 
99 
A (17) I x) 
(3) 极 值 条 件 
aH_ 
au | 
内 点 约束 条 件 
n| x(t) ,ti |=0 
A (ti )=A Cr ) + 5 
HG )=HGt)—n 


(2-113) 


(2-114) 


在 定理 2-17 中 , 式 (2-109). 式 (2-113) 和 式 (2-114) 共 给 出 (9 十 2 十 1) 个 方程 ,正好 可 


es dn 。 


以 确定 x .xzG) 和 主 共 (q 十 2 十 1) 个 未 知 量 。 因 此 , 求 具有 内 点 约束 的 泛 函 极 值 问题 ,需求 


解 三 点 边界 值 问题 ,求解 过 程 更 加 困难 。 
定理 2-17 还 表明 ,在 内 点 时 刻 t 上 ,虽然 状态 向 量 x(G) 是 连续 的 ,但 协 态 向 量 人 (t 和 
哈密 顿 肾 数 五 是 不 连续 的 。 式 (2-113) 和 式 (2-114) 称 为 A(G) 和 五 在 内 点 上 的 “跳跃” 


条 件 。 
习 起 


2-1 设 性 能 泛 郴 为 
J=| [zz AizGD]d 
试 求 
(1) 86J 的 表达 式 。 
(2) 当 rt)= 二 ,6rx 二 0. 1t 和 5x 二 0. 21 时 ,6J 的 值 。 
2-2 已 知性 能 泛 函 为 


=| (4+)d 
试 求 其 变 分 6J。 
2-3 试 利用 变 分 公式 
J = (x,edx) | 
求 泛 良 
T=| Gridt 
的 变 分 ,并 写 出 相应 的 欧 拉 方程 。 


2-4 设 X= 二 x) ,0 二 t 志 1, 求 从 zx(0)= 二 0 到 xz(1)=1 之 间 的 最 短 曲 线 。 
2-5 求 通过 z(0)=1,z(1) 一 2, 使 下 列 性 能 泛 函 为 极 值 的 极 值 曲 线 x* (4)， 


7 一 | Ga+zad: 


2-6 已 知 状 态 的 初 值 和 终 值 为 
zr(1)=4, Zir) 一 4 
式 中 心目 由 且 ti>1, 试 求 使 下 列 性 能 泛 函 达到 极 小 值 的 极 值 轨 线 x+* (12); 


J= | [2z(2) + L220) dr 
1 2 
2-7 设 性 能 泛 郴 为 
7 一 | GHzz?di 
心 


求 在 边界 条 件 x(0) 一 0,z(1) 自 由 情况 下 ;使 江 隙 取 极 值 的 极 值 轨 线 x* (1)， 
2-8 设 泛 本 


t 

7 
7=| 了 (zi LE » 直 ] ) st ) dr 

1 

0 


。 46。 


症 点 A(zxio;T20sto) 国 定 , 端 点 B(x (fy) ,Xxz(ty),t/) 可 沿 空间 曲线 
ctr) 一 CCtr)， ctr) 一 VCtr) 
移动 。 试 证 : 当 泛 函 取 极 值 时 , 模 截 条 件 为 


,90L  ,;,  39L1 | 
[ee 一 0 


‘Ff 


2-9 求 使 学 
J1=| (+20z+2)dt 
为 极 值 并 满足 边界 条 件 
XTi1(0)=0, zx,(0)=0 
A 也 
-| 下 -1， | 
的 极 值 轨 线 zx? (1) 和 zz (1)。 


2-10 “ 求 下 列 性 能 泛 函 的 极 值 曲线 z* (4)， 
7=| | 到 空 十 zz 十 环 十 | dt 


已 知 t=0,7() = t= 1 rt)) 上 自由。 

2-11 已 知 一 阶 系统 

i(1)=— rt) +au() 
试销 定 最 优 控 制 x" (1) ,使 系统 由 xz(0)= 二 3 转移 到 zx(zy) 一 0, 其 中 zj 自由 ,并 使 下 列 性 能 
指标 为 极 小 值 : 
1=| (+u dt 
2-12 设 二 次 积分 模型 为 
0 =wt), w(t)=ult) 

性 能 指标 


ll ,， 
J=3| wd 


已 知 初 态 0(0)= 二 w(0)= 二 1, 末 态 0(1) 二 0,w(1) 自 由 , 试 求 最 优 控 制 u* (1) 和 最 优 轨 线 0* (4) 
与 w* (1), 
2-13 设 系 统 状态 方程 
ti(t)=Zz2(t), zx1(0)=2 
T(t)=—=u(lt), x,(0)=1 
性 能 指标 
J=3| wd 
要 求 达到 x(zy)= 二 0, 试 求 
(1) ty 二 5 时 的 最 优 控制 x* (4)， 
(2) ty 自由 时 的 最 优 控制 ww* (2)。 


es 7 »。 


2-14 设 一 阶 系统 
Zt)=u(t), CO) 一 ] 
性 能 指标 
J 一 于 | (x? tw)dt 
2 J0 

已 知 z(1) 王 0。 某 工程 师 认 为 ,从 工程 观点 出 发 可 取 最 优 控制 羡 数 xz (2) 二 一 1。 试 分 析 他 
的 意见 是 否 正 确 , 并 说 明理 由 。 

2-15 已 知 一 阶 系 统 


2(1)=—37(t) +ult), xz(0)=2 


性 能 指标 
7 一 言 [loz:(1)] 十 却 | (2z* 二 wdi 


求 最 优 控制 x* (7)。 
2-16 已 知 系统 方程 
ZI (Et 一 一 2 (1 十 zz， Ti1(0)=0 
Zati) 一 zt 0) 一 0 
目标 集 为 
ZiCtr) 十 ztr) 一 好 十 ] 
式 中 尹 目 由 。 试 写 出 使 性 能 指标 


7 一 去 | wd 
2 Jo。 


为 最 小 的 必要 条 件 。 
2-17 设 一 阶 系统 
Z(t)= 4u(t) 
性 能 指标 


J/=| (z+ du dt 


式 中 /已 知 。 试 求 w* (1), 使 系统 由 zx(0) 二 zo 转移 到 z(4y) 二 zy, 并 使 达到 最 小 值 . 
2-18 设 二 阶 系统 
Xi1(t)=7x2(t), X10)=1 
Z(t)=u(lt), x2(0)=1 
性 能 指标 
1=| Cr?+t ul yd 


求 最 优 控 制 u" (2) ,使 7 达到 最 小 值 ,并 画 出 最 优 控 制 及 最 优 轨 线 .。 
2-19 设 二 阶 系统 
fi) 一 To XxX1(0)=1 
T(t)—=u(lt), zx.(0)=1 
性 能 指标 
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式 中 7 自 由 o 目标 集 
Zitr) 一 CCtr) 一 一 好 
试 求 最 优 控制 x& (及 最 优 轨 线 x (9 ， 并 画 出 其 图 形 。 
2-20 设 系统 方程 .初始 条 件 及 性 能 指标 同 题 2-19,zr 自由 ,目标 集 为 
Tt 一 ct 一 一 弛 
X(tr)—0 


求 最 优 控制 x&” (2) 及 最 优 轨 线 x (2) ,并 男 出 其 图 形 ，。 
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第 3 章 极 小 值 原理 及 其 应 用 


利用 古典 变 分 法 求解 最 优 控制 问题 时 ,只 有 当 控 制 向 量 &(i) 不 受 任 何 约束 ,其 容许 
控制 集合 充满 整个 m 维 控制 空间 ,用 古典 变 分 法 来 处 理 等 式 约束 条 件 下 的 最 优 控制 问题 
才 是 行 之 有 效 的 .然而 ,在 实际 物理 系统 中 ,控制 向 量 总 是 受到 一 定 的 限制 ,容许 控制 只 能 
在 一 定 的 控制 域内 取 值 ,可 以 预料 ,用 古典 变 分 法 将 难以 处 理 这 类 问题 ,例如 ,在 时 间 最 优 
控制 问题 中 ,最 优 控制 的 取 值 正 是 在 控制 域 方 体 的 角 点 上 跳 来 跳 去 ,这 时 的 u(t) 也 不 再 
是 时 间 的 连续 函数 ,而 只 是 分 段 连续 函数 。 而 在 有 些 问 题 中 ,容许 控制 集合 甚至 只 是 控制 
空间 中 一 些 孤 立 的 点 ,对 这 样 的 控制 问题 ,古典 变 分 就 更 加 无 能 为 力 了 ,因此 ,需要 探讨 新 
的 理论 和 新 的 方法 。 

前 苏联 学 者 庞 特 里 亚 金 等 人 在 总 结 并 运用 古典 变 分 法 成 果 的 基础 上 ,提出 了 极 小 值 
原理 ,成 为 控制 向 量 受 约束 时 求解 最 优 控 制 问题 的 有 效 工具 ,最 初 用 于 连续 系统 ,以 后 又 
推广 用 于 离散 系统 。 


3.1 连续 系统 的 极 小 值 原理 


最 优 控制 问题 的 具体 形式 是 多 种 多 样 的 。 为 了 方便 并 述 , 先 研究 定常 系统 、 末 值 型 指 
标 .末端 自由 控制 问题 的 极 小 值 原理 ,然后 将 所 得 结果 逐步 扩大 到 一 般 的 最 优 控制 问 
题 中 ， 


3.1.1 上 自由 末端 的 极 小 值 原理 


定理 3-1 对 于 如 下 定常 系统 .未 值 型 性 能 指标 .未 端 自由 、 控 制 受 约束 的 最 优 控制 

问题 
min ,J (u) ~gq x(t) | 
Ste XO)=f uD) x0)—xo, itE [tt] 

式 中 x(1)ER', 为 系统 状态 向 量 ;wu(i)E R”, 为 系统 控制 向 量 ;Q 为 容许 控制 域 ;uw() 是 在 
2 内 取 值 的 任何 分 段 连续 函数 ;末端 时 刻 tj; 未 知 ; 末 态 x(ty) 自 由 。 假 设 

QD 函数 f(x,u) 和 xz) 都 是 其 自 变 量 的 连续 函数 ; 

四 基数 f(x,u) 和 g(x) 对 于 x 是 连续 可 微 的 , 即 3J/axT 和 3g/9x 存在 且 连 续 ，; 

G) 函数 f(x,w) 在 任意 有 界 集 上 对 变量 x 满足 李 卜 希 芯 条 件 : 当 0,CQ 为 有 界 集 时 ， 
存在 一 常数 a 汪 0, 使 得 只 要 x!、x:Ex, 对 于 任意 wE 40, 有 

/ [flx sm) — fr wu) ISalr'—r’| / 

则 对 于 最 优 解 a* (zt) 和 ,以 及 相应 的 最 优 轨 线 x (7), 必 存在 非 零 的 n 维 向 量 函 数 A4 G4)， 
使 得 , 

QD x(2) 及 4 (2) 满 足下 述 正则 方程 ， 
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如 
X(1) 一 本 下 (3-1) 


a 
下 (21) 二 一 了 这 (3-2) 
式 中 哈密 顿 男 数 
Hxsu,d)—=A Gfx,u) (3-3) 
@ x 0) 及 A 4) 满足 边界 条 件 
(fo) = x 
(3-4) 
A (£7) = jE ) 
@B) 哈密 顿 吨 数 相 对 最 优 控制 为 极 小 值 
Hx’ su ,A)= min Hx 29A (3-5) 
(4) 哈密 顿 隐 数 沿 最 优 轨 线 保持 为 常数 。 
当心 固定 时 
Hlx’* Gu 0AG) =HLx’ (G7) uu (7) ,A (7) 一 const (3-6) 
当 zj 自由 时 
Hlx’* (G71),u’ G7),AC)|=0 (3-7) 


将 上 述 庞 特 里 亚 金 原理 与 变 分 法 的 结果 相 比 ,可 以 发 现 ,二 者 结果 的 差别 仅 在 于 条 件 
@@。 妆 控 制 无 约束 时 ,相应 条 件 为 3 五 /ax=0, 即 哈密 顿 函 数 妃 对 最 优 控 制 u* (4) 取 驻 值 ; 
当 控制 有 约束 时 ,3 碧 /ax 一 0 不 再 成 立 ,而 代 之 为 
再 [rt (1),A (2) HELx" (2) ;u(t) ,A (2) | 


即 对 所 有 t€ELzoytyj,wubt) 取 遍 Q 中 的 所 有 点 ,wu (4) 使 态 为 绝对 极 小 值 。 因而 庞 特 里 亚 金 
原理 一 般 称 为 极 小 值 原理 。 

当 极 小 值 原 理 出 现 后 ,第 2 章 中 所 讨论 的 变 分 法 就 称 之 为 经 典 变 分 法 了 。 与 经 典 变 分 
法 相 比 , 极 小 值 原理 的 重要 意义 有 如 下 几 方 面 。 

1) 容许 控制 条 件 放宽 了 .。 在 经 典 变 分 法 中 ,需要 假设 0CR", 即 控制 域 充满 全 部 控制 
宝 间 。 从 控制 变 分 6u(z) 的 任意 性 出 发 ,导出 极 值 条 件 9 如 /3u 二 0。 这 一 极 值 条 件 虽 然 简 
单 , 但 应 用 起 来 受到 很 大 限制 ,例如 ,在 末端 固定 的 情况 下 ,导出 驻 值 条 件 3 五 /3 二 0 也 
并 不 容易 .然而 极 小 值 原理 中 的 极 小 值 条 件 @@ 对 于 通常 的 控制 约束 均 适用 ,用 极 小 值 原理 
来 求解 各 种 最 优 控制 问题 ,不 会 遇 到 很 大 的 困难 。 

2) 最 优 控 制 使 哈密 顿 函 数 取 全 局 极 小 值 。 对 1€ [to,tyj 上 的 任意 连续 点 , 当 容 许 控 制 
u(t) 取 过 了 控制 域 旬 的 所 有 点 ,定理 3-1 中 的 条 件 @@ 都 应 成 立 ,换言之 ,oz (使 互 取 全 
局 最 小 值 。 如 果 把 条 件 久 也 称 为 极 值 条 件 , 则 它 是 使 豆 取 强 极 值 的 条 件 。 而 在 经 典 变 分 法 
中 ,由 于 w” (2) 只 与 “接近 ”的 wli) 相 比较 ,所 以 w* (只 能 使 鼠 取 弱 极 值 , 甚 至 只 能 得 到 
于 的 驻 点 条 件 。 不 难 理解 , 当 满 足 经 典 变 分 法 的 应 用 条 件 时 ,3 互 /3u= 二 0 是 定理 3-1 中 条 
件 色 的 一 种 特例 。 

3) 极 小 值 原理 不 要 求 哈 密 顿 函数 对 控制 的 可 微 性 ,因此 ,应 用 条 件 进一步 放宽 ,在 经 
典 变 分 法 中 ,对 函数 和 工 的 可 微 性 要 求 很 严格 ,特别 是 要 求 9L/39u 存在 ,但 实际 工程 问 
题 往 往 不 满足 这 一 条 件 。 例 如 ,在 燃料 最 优 控 制 系统 中 ,性 能 指标 泛 函 的 形式 为 
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它 就 不 满足 上 述 要 求 , 因 而 无 法 用 经 典 变 分 法 求解 最 优 控制 ,而 只 能 用 极 小 值 原理 求解 。 
4) 极 小 值 原理 给 出 了 最 优 控 制 的 必要 而 非 充分 条 件 。 换 言 之 ,满足 极 小 值 原理 的 控 
制 是 否 真 能 使 性 能 指标 泛 函 取 最 小 值 ,还 需 进一步 判断 .如 果 由 实际 问题 的 物理 意义 已 经 
能 够 判定 所 讨论 问题 的 解 是 存在 的 ,而 由 极 小 值 原理 所 求 出 的 控制 又 是 唯一 的 ,可 以 断 
言 ,所 求 出 的 控制 就 是 上 要 求 的 最 优 控制 。 实 际遇 到 的 工程 问题 往往 属于 这 种 情况 。 此 外 ， 
可 以 证 明 ,对 于 线性 系统 的 最 优 控制 问题 , 极 小 值 原理 给 出 的 是 必要 充分 条 件 。 
例 3-1 设 二 阶 系统 的 状态 方程 及 初始 条 件 为 
ZE) 一 一 Ti 十 xi， ri(0)=1 
Zat) 一 it)， zx.(0)=0 
式 中 标量 控制 x&() 的 约束 条 件 为 
《下 < 
各 系统 的 末端 状态 x(iy) 是 自由 的 , 试 求 最 优 控 制 * (4) ,使 性 能 指标 
了 一 zy(] ) 
取 极 小 值 。 
解 ”本 例 为 定常 系统 .未 值 型 性 能 指标 .未 端 自 由 ,国定 和 控制 受 约束 的 最 优 控制 
问题 。 由 题 意 
dx(t1) |=zx(1), t=]1 


令 哈 密 顿 函数 
五 (rz 只 ) 二 A 一 wi 十 Ww) 十 Asxi 
根据 正则 方程 
| oH 
和 二 一 3 一 一 
| oH .~ 
省 
因而 
Ai (一 Cie: 十 c， 
Mt) 一 c， 
式 中 c, 和 c: 为 待定 常数 。 
由 横 截 条 件 (3-4) 得 
hi 一 卫生 一 


9 _ 
1 一 3 一] 


解 出 cl 二 一 e-!,c, 二 1,- 故 有 
A1 (1)=—=1—e”! 
由 极 小 值 条 件 (3-5) ,得 
7 (£) = —sgn {Nh (£))} 
不 难 发 现 : 四 (0) 一 1 一 e-: 盖 0,(1) 一 0, 即 
。592 。 


A(t)=1—e >0, VtELo0,1) 


故 所 求 最 优 控制 为 


一 ]， VEG|10,1) 
wu (ti) 一 
0 ， :=|] 


3.1.2 极 小 值 原理 的 证 阴 


庞 特 里 亚 金 在 其 原著 中 ,用 了 很 大 篇 幅 对 极 小 值 原理 作 了 严格 的 数学 证 明 , 其 中 包括 
一 系列 引 理 和 定理 ,涉及 包括 拓扑 学 在 内 的 许多 数学 问题 .后 来 有 些 学 者 用 增 量 法 对 极 小 
值 原理 提供 了 浅 近 的 证 明 。 用 增 量 法 证 明 极 小 值 原理 涉及 的 数学 知识 较 少 , 推 证 过 程 简 
涪 , 多 于 理解 。 在 证 明 过 程 中 ,需要 采用 如 下 5 引 理 。 


5 引 理 3-1 
d 1 . 
J Ax|< |Ax| 
证 明 因为 
Ax|=| Az | 
从 而 得 
d 1 1 . . ， 
dr | Ax | 一 2 TAXT 2AzA2 十 2AzsAzy 十 2AT,AT,) 
_ 《AX ,Ax) 1 ， 
一 人 STAzTIAx| | AX | 


引 理 3-2 设 45(i) 为 分 段 连 续 函 数 , 且 6G() 宇 0, 若 函数 z() 满 足下 列 不 等 式 ， 


Fz) arlt) 46) ， X(to)=0 


则 有 
zr)| eb(s)ds, 1tElto,ty) 
证 明 将 给 定 的 不 等 式 写 为 
Fz) —ar() bt) 
两 边 乘 以 e “2 ,得 
FLe-“z(t) J<e "be) 
从 志 到 上 积分 上 式 , 并 注意 到 '`z(tb) 一 0, 可 得 
zE| ee nols)ds 
应 当 指 出 ,定理 3-1 中 的 四 条 假设 是 使 得 下 述 证 明 过 程 得 以 顺利 进行 的 前 提 。 其 中 假 
设 人 是 为 了 保证 微分 方程 解 的 存在 和 唯一 性 。 用 增 量 法 证 明定 理 3-1 的 过 程 如 下 。 
(1) 性 能 指标 沁 函 在 w(t)= 二 w* (G4) 时 的 增 景 


我 们 只 推 证 末 态 x(t/) 自 由 、 末 端 时 刻 ty 固定 的 情形 。 根据 LxCt/)] 对 x(2y) 的 连续 可 
微 性 假设 ,性 能 泛 函 的 增 量 可 表示 为 
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AJ 一. (，) 十 Ag(。，)j 一 AL ，) 
一 VB[LxGtr) 十 Ax(Gr)] 一 9LX (ty) | 
9” (£7) 
ax (ty) 
式 中 及 x 分 别 表示 最 优 控制 及 相应 的 最 优 轨 线 ,od |Ax(i) |) 表 示 泰 勒 级 数 展开 式 中 
关于 Ax (zy) 的 高 阶 项 。 
为 了 从 泛 函 增 量 Ay7 之 0 的 条 件 导出 最 优 控制 的 必要 条 件 , 应 求 出 状态 增 量 Ax(2) 与 
控制 增 量 Au(2) 之 间 的 关系 ,进而 对 Ax(t) 作 出 估计 ，。 
(2) 状态 增 量 的 表达 式 
根据 天 数 f(x,u) 对 x 的 可 微 性 假设 ,由 状态 方程 
X(t)—= xu), X(to)—xo : (3-9) 


Ax(ts) ol(|Ax(zy) |) (3-8) 


可 写 出 其 增 量 表达 式 


af [x* CG) ,wu Au()] 
ax! 


十 {FLx Gu GHAuG) |— fx Gu’ GG) |) 
_9flx" CD CE) 


Az (1)= Ax(t) 十 ofCAx(G) |) 


Ax(i) 十 {FLz (GD (十 Ag 人 Gt)] 一 FLx (ta GG) ]) 


arx'(i) 
9 CD CD 十 Au 9flx’ GD) 2). 
ax! (#) axr' (1) 
Ax(t)o(|Ax()|) (3-10) 
设 下 列 线 性 方程 ; 
Ax— 9 fs) 2 Ax 
dx 
的 状态 转移 矩阵 为 ® (z,s), 满 足 

do@(,s) =- RCE" (4,s) 
dt (3-11) 

Ds,s)—1 


考虑 到 Ax(zio) 二 0, 则 方程 (3-10) 在 1 一 上 时 的 解 为 
Ax(n)=|'@ Gr) {FEx CG su CG) + AG)]— fix Gs) yu (3) 1)ds 


gjLz CG) nu (+AuCGs)] Gflx’ (G3),u’ (5)] 


JT Cs) xTes) Ax(s)ds 


二 | cr 


二 | olarG) ds (3-12) 
式 (3-12) 给 出 了 满足 微分 方程 (3-9) 约 束 的 Ax 与 Au 的 关系 。 将 式 (3-12) 代 入 式 (3-8)， 


og xr" (#7) | fy 


AJ = DT) js (rsS)(Lx (s) ,wu (CS) 十 ARCS) ] 


a x (tr) | ‘f 


—flx* Gu (0) J}ds+ Se | (5 。G(G) » AxCs)ds 


e bde 


+00 和 foclAxcsyl)ds 上 oClAxrc) (3-13) 
dx (tr) to 


式 中 
,~、_ [aflx’ GCs),u’ CG)+AuGs)| ar CD) (s) 
G(s)= | 9x'(s) dx! Cs) 


式 (3-13) 给 出 了 性 能 指标 泛 函 增 量 AJ 与 Au、Ax 的 关系 , 且 对 任意 的 An 均 可 成 立 , 为 此 ， 
取 一 种 特定 的 控制 变 分 Au, 以 便于 对 式 (3-13) 中 的 各 项 进行 估计 。 
(3) 对 状态 x(2) 的 估计 
设 AuQ) 是 wwQ) 的 任意 变 分 ,对 应 的 xQ) 的 增 量 Ax() 应 满足 下 列 方程 ; 
Ax(t)= fx AxXG) EC 十 Ar 人 ti) ]— flx() ,u(t) | (3-14) 
Ax(to)=0 (3-15) 
将 式 (3-14) 改 写 为 
AxX(E)=f Lx) ArG) ,wt) AuG) I— flxCG) uC) tAu()) 
十 FLxzGD) CGI 二 Ang) )— flx(t) ,u(t) ] (3-16) 
对 于 给 定 的 u(t) 和 Au(i), 由 于 其 分 段 连 续 性 假定 , 必 存 在 有 界 集 QICQ.、XCR", 使 
zi) 十 AUDEA YEX YEELatr。 根 据 李 卜 希 茨 条 件 , 必 存 在 一 常数 a 守 >0, 满 足 
| flx OAxCG) GD 二 AgG)j 一 FLxGae) 十 AgG)]| salAxCo | (3-17) 
有 是 由 滑 数 fx,z) 对 zx 的 连续 性 知 , 必 存 在 5( 世 之 0, 使 下 式 成 立 : 
[Ex sud) HF Au) I— fx ut) SoG), VtEelfe,,t) 


式 中 
0 ， 当 Ar (ri) 一 0 
b(t) = (3-18) 
b( 常 数 )， 当 Au(1) 关 0 
于 是 ; AX C(t) 满足 
|AXC) |<a | AxC) | 十 BC (3-19) 
根据 引 理 3-1, 式 (3-19) 变 为 : 
CIAxl<alAxr() 1 十 6 (3-20) 
再 由 式 (3-20) 及 式 (3-15), 依 引 理 3-2 ,可 得 
[Ax (i) <| eco(s)ds, LE fr, (3-21) 


至 此 ,我 们 并 没有 对 Au(z) 作 任何 限制 。 为 了 使 。 
变 分 后 的 控制 仍然 是 一 容许 控制 , 且 有 利于 导出 定理 
3-1 中 的 极 小 值 条 件 (3-5) , 取 Au (1) 为 异 于 经 典 变 
分 形式 的 针 状 变 分 。 针 状 变 分 的 示意 图 如 图 3-1 所 
示 。 图 中 ,c 为 最 优 控 制 w* (5 的 任意 一 个 连续 点 ,全 
0 为 某 一 确定 的 数 ,se 二 0 是 充分 小 的 数 。 

将 控制 变 分 Au(i) 取 成 依赖 于 oc、 的 针 状 变  。p 
分 , 记 为 Au (Ci), 则 Aseu (2) 可 表示 如 下 : 图 3-1 针 状 恋 分 示意 图 
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人 (1), toSt<o 及 oel<it<ty 
2 (1) Adult) =4 (3-22) 
: u,， IO 和 1 上 刀 CC 十 EL 
式 中 wxE0, 表 示 容 许 控制 ,就 是 说 ,在 充分 小 的 时 间 区 间 [c,c 十 eg 内 ,可 以 取 控 制 域 人 
内 的 任何 点 ,包括 闭 域 2 边界 上 的 点 。 所 以 ,Ag 人 (一 z 一 8 CE [toytyj], 是 一 个 有 限 
量 。 当 为 一 充分 小 量 时 ,由 Auu(i) 引 起 的 Ax(i) 仍 可 能 是 一 充分 小 量 。 可 以 证 明 , 由 针 状 
变 分 Au(t) 所 引起 的 状态 增 量 Awx(t) 是 一 与 同 阶 的 无 穷 小 量 。 

事实 上 , 当 控 制作 针 状 变 分 时 , 式 (3-18) 可 改写 为 
0， 当 6 委 上 ca 十 Bi 魏 轧 
(各 数 )， 当 c 委 三 c 十 eL 


50=| (3-23) 


于 是 ,不 等 式 (3-21) 恋 为 
|Ax (C2) | <| ee Wb)dsS| er nbs)ds 


<eo| ‘p(s)ds—e"/pel (3-24) 


式 (3-24) 表 明 .|Ax(z)| 与 0 是 同 阶 小 量 。 
由 式 (3-13) 可 得 , 当 控 制作 针 状 变 分 Az(b 时 ,性 能 指标 泛 函 的 增 量 为 


oe 9 x (+ ) 
Au 7=| 2 ls ($95) {fl x (5s) su (5) Aus) | 


dg x"* (#1) | s+el 
xT (£7) | 9 (£1,5) ” 


[2 (Cs) 3) 十 Au()] 9Fflx’ (s),u’ (5)] 
ax (s) ax' (s) 


— frx* Gs) ou’ (Gs) J)ds+t 
Ars)ds 


2 * st 
Oe oC(|Ax(Cs)|)ds+ol|Ax() |) (3-25) 


式 (3-25) 中 后 三 项 都 是 e 的 高 阶 小 量 , 可 归并 成 一 项 ,以 ol(e) 表 示 。 于是, 式 (3-25) 可 写 为 
A = | OR ED) Cr Gu G8) HAG) frx* Gs) vu CG) 1)ds hoce) 


十 


9x (tr) 
(3-26) 
若 令 
9 (t7) 
A'ls ) 一 全 人 (tryS) (3-27 ) 
则 协 态 问 量 4 G3) 必 满足 状态 方程 (3-9) 的 协 态 方程 
了 下 并 ， 证 
1)=— 1 6) (3-28) 
以 及 横 堆 条 件 
99Lx (Cr) 
A (1 一 50 (3-29 ) 
硅 记 哈密 顿 油 数 
Hlxsu,A)=A flx,u) (3-30) 


则 协 态 方程 (3-28) 可 写 为 


* hos 


9H(x’,u’,A) (3-31) 
ax 


于 是 ,定理 3-1 中 结论 外 和 包 得 证 。 而 式 (3-26) 则 可 改写 为 
As/=| [re CD 上 AGO 一 有 [rs)]) ds 十 o(e) 


A()= 


(3-32) 
《4) 极 小 值 条 件 的 推 证 
因 为 已 设 中 (2) 是 使 性 能 指标 泛 阿 取 极 小 值 的 最 优 控制 ,x (是 相应 的 最 优 轨 线 ， 
A (2) 是 协 态 方程 的 解 , 所 以 对 任意 的 控制 变 分 ,包括 对 ub) 的 针 状 变 分 ,性 能 指标 泛 孙 的 
增 量 (3-32) 必 满足 下 列 不 等 式 : 


呆 十 总 
Acy 一 | (DLA SS) 十 AuG) |— Hix’ GCG),ACGs) uu Gs) ds 十 ofe) 之 0 


(3-33) 
由 于 在 1€ liotyj 区 间 内 ,x* (1》 和 4 (1) 都 是 连续 的 ,而 Ww” (4) 和 w= 二 ww” (1) 十 Awu (ti) 在 
式 (3-33) 的 积分 范围 Lc,c 十 ej 内 也 是 连续 的 , 故 扎 是 一 连续 困 数 。 根 据 积 分 中 值 定 理 及 
瓦 的 连续 性 ,有 
| 《ae (AC su C8) FAC) Hfx* G) ,A CG) su CG) ds 


=el{HLx’ (2) ,A GC) su (+A — HEx (DA C0 0)1) 1 
=el{Hlx’ (o),A (oo) su’ (oO)+Aulo) |— Hlx’ (Ac (G0)1) 十 o(Ce) 
式 中 妨 二 oa 十 0el ,0 过 9 过 1。 将 上 式 代 和信 式 (3-33), 得 
AcJ =el{HIx’ (0o) ,A lg),su’ (0) Aulo) I— HL[x' (go) ,ACo) uu’ ) 十 oCe) 二 0 
用 e 际 上 式 , 并 考虑 到 e 一 0 时 ,1 二 0, 可 得 
Hlx’ (o),A(o) ,ul—H[x’ (Ac (0) >0 
或 瑟 为 
Hlx’(o),A(o),u’ (0o) JHIxY’ Ca) ACE] (3-34) 
式 (3-34) 对 于 1€ELioytyj 内 wu (的 所 有 连续 点 都 成 立 。 考 虑 到 & 要 取 遍 控制 域 2 中 的 所 
有 点 ,因此 式 (3-34) 也 可 以 表示 为 
机 La) ACE (0)J=minHLx" (go) ,A (0) ,a (3-35) 


式 中 o 同样 是 区 间 [o,ztyj 内 w* (2) 的 任意 连续 点 。 由 于 假定 wu(i) 是 分 段 连 续 函 数 , 而 u* (1) 
的 不 连续 点 上 的 函数 值 不 论 如 何 都 不 会 影响 其 控制 效果 ,因此 ,不 妨 认 为 式 (3-35) 对 任意 
cE [tostyj 均 成 立 。 也 就 是 说 ,车 wu (4)EQ0,1E [to,ty] 是 最 优 控 制 , 则 对 所 有 iE [yzr] 都 
必须 满足 
Hix’ (2),4 (ED (= min HLx" (1) ,A (1) ,u(t) | 
或 者 
Hlx’ (2) ,4 GD (4) RHELx (4) ,A () ,u(t)) 
V tiEliot u(t) EN 
从 而 证 明了 定理 3-1 中 的 结论 @ 成 立 。 
(5) 哈密 顿 函 数 沪 最 优 轨 线 的 性 质 


。S7 。 


当 末 端 时 刻 ty 自由 时 ,需要 考虑 娘 改 变量 所 引起 的 泛 函 增 量 。 令 恬 的 改变 量 为 
Af r 一 eT” (3-36) 
式 中 了 7 为 任意 实数 , 设 wu' (1) 和 zt} 是 使 性 能 指标 泛 函 取 极 小 值 的 最 优 解 ,x* (2) 为 相应 的 
最 优 轨 线 。 根 据 q_x(iy)] 的 可 微 性 ,并 参考 式 (2-94), 有 


9dx” CE) ， Lf 
A/ Fr) LAX) tx 《过 )Azr | 十 of(s) 


gz (fr) kK x 其 


agLx* (ft7)] l 
xT Axz( to(e)0 (3-37) 


式 (3-37) 对 任意 Ti 及 任意 控制 变 分 均 成 立 ,当然 对 Au(z) 三 0, 也 应 成 立 。 由 式 (3-12) 知 ， 
当 t 二 tj ,Au(s) 二 0 时 , 必 有 有 Axlii) 一 0; 由 式 (3-13) 知 ,同时 应 有 AJ=0。 在 式 (3-37) 中 ， 
因 eT" 了 尖 0,- 故 应 有 


OMX (FON 
x) HL (ff ):2 (t7) |=0 (3-38) 


由 式 (3-27) 知 , 当 s==tjy,tj==t} 时 ,有 
于 是 式 (3-38) 可 写 为 
A C7) Fx CG) wu G7) =H[lx' (;), (7 ) yu’ (£7 ) |=0 
从 而 证 明了 式 (3-7) 成 立 。 
当 取 Ti 二 0 时 ,对 于 针 状 变 分 Asu(1) ,应 有 


WE (7)], 
一 TAO ) 十 o(e) 守 0 
可 以 证 明 

Hlx’ Cr 一 万 G) ,wu (1),N (£) | 一 const 


表明 式 (3-6) 同 时 成 立 。 因 此 ,定理 3-1 中 的 结论 鸭 成 立 。 
3.1.3 极 小 值 原理 的 一 些 推 广 形式 


定理 3-1 是 针对 定常 系统 .未 值 型 性 能 指标 导出 的 ,但 许多 常见 的 最 优 控 制 问题 都 可 
以 化 为 这 种 形式 ,从 而 可 把 极 小 值 原理 推广 成 各 种 便于 应 用 的 具体 形式 。 

(1) 对 于 时 变 问题 的 推广 

如 采 描 述 最 优 控制 问题 的 一 些 函 数 , 如 f 和 yp 等 显 含 时 间 i 或 tj, 则 称 为 时 变 问 题 ， 
过 过 引入 新 状态 变量 的 方法 ,可 以 将 时 变 问 题 化 为 等 价 定常 问题 ,然后 应 用 定理 3-1 的 结 
论 ,得 到 时 变 系 统 的 极 小 值 原理 ，。 

定理 3-2 对 于 如 下 时 变 系统 、 末 值 型 性 能 指标 、 末 端 自 由 、 控 制 受 约束 的 最 优 控制 
问题 

min 7 (u) = x(t) tr 
St X=fx ut), X(to)=x, 


e DBs 


上 GE Lto,ty]， tj 未知 
假设 同 定理 3-1。 若 心 (2) 和 是 使 性 能 指标 取 最 小 值 的 最 优 解 ,x* (7) 为 相应 的 最 优 轨 
线 , 则 必 存 在 nn 维 向 量 孙 数 X (2) ,使 得 ww (1)、x* (2) .ty 和 4 () 满 足 如 下 必要 条 件 : 
GQ) x() 及 4 (2) 满足 下 述 正则 方程 : 


Xf)= 
aH 
下 (2) = 一 3 
式 中 蛤 密 顿 了 消 数 
HxoA ust)—A (GG) fx,u ,i) 
CI x(t) 及 A (Ci 满足 边界 条 件 
X(to) 一 0 
DY9LYZCtrD) tr 
A NT Ix) 


3) 哈密 顿 函 数 相 对 最 优 控 制 取 绝对 极 小 值 
Hlx’* (£) ,人 (1) su (£) ,| 一 min HLx. (#) ,人 (£1) s(t) ,| 


4) 在 最 优 轨 线 末 端 哈密 顿 函 数 应 满足 

HEx* G7) A GF) su (7) ,t=— 
() 沿 最 优 轨 线 哈密 顿 函数 变化 律 
HEx* Cs = HE GD A psa GD) | std 
证 明 引入 新 的 辅助 变量 x,, ,二 ,使 其 满足 


Ta+1 一 1， n+l (to ) 一 to0， Xn+1(t7) 一 了 


9399Lxz (1) 
dtr 


构造 增 广 向 量 
zw=| ”| 7 
1 l 
_ 0 
za 一 | = (3-39) 
to 
则 原来 的 时 变 问题 代为 如 下 定常 问题 ， 
min J =X)] = A zat (47)] (3-40) 
st. xD 一 了 [ECG wd)]， X(to)=x, 
今 ， 
_ -|， (上 ) 
A(t) 一 | (3-41) 
式 中 丸 ,1(2) 为 辅助 协 态 变量 。 对 问题 式 (3-40) 构 造 哈 密 顿 了 消 数 
H[x() AC ,nt) =A GF Cx,n) 
—A' (fr uit) A 2) 


~Blx(),A (2) ,WE) ,t+ 1 (0) (3-42) 
| e 中 号 。 


式 中 
H[xCG) AG) ud =A Gf x,u,t) 
将 定理 3-1 应 用 于 定常 问题 式 (3-40) 。 根 据 协 态 方程 (3-2) 
FACIL EL 
dx 
代入 式 (3-41)、 式 (3-42) 和 式 (3-39) ,得 
OH(xA ,uu,t) 


9 ]- Ax 

外 Ca 再 CA ze 
ot 

因而 有 


9H(x,A RE) 
dx 


oH(x,A,u,i) 
hn = 


有 (一 


由 式 (3-43) ,下 式 显 然 成 立 ， 


9H(x,A,u,i) 
DA 


T(t) 一 = f(x,u,L) 


从 而 证 明了 定理 3-2 中 结论 外 是 成 立 的 。 
根据 定理 3-1 中 的 条 件 @ ,定常 问题 式 (3-40) 的 横 截 条 件 


一 aqx(t)] 
A WOT) 
也 即 
aofx(tr)] dg x(ts) ,ts 
《3 |= 9x(tr) dx(tr) 
A+1(ty) 9 Gx ts) ) 9 gx) tr 
9 Tri1(tr) gtr 
从 而 得 


_ 9G x(ty) ,ty] 
A (DT rd) 


A (1) =— E24 
fi 
于 是 ,证 明了 定理 3-2 中 的 结论 @)。 

由 定理 3-1 中 的 极 小 值 条 件 (3-5) ,有 

HELx’ (DA Gm (DJ= min HLx* (2) ,A (1) uC) |] 
代入 式 (3-42) ,上 式 可 写 为 
Hlx’ (A CG) ,uw (Dstt hr) = min HLx (2) A(t) u(t) ,A104) 
于 是 得 
Hlx’ (Ci ACE (1) t= min HLx* (2) ,A (1) ,u(t) ,| 

从 而 证 明了 定理 3-2 中 的 结论 @， 

由 于 必 自由 ,根据 定理 3-1 中 的 式 (3-7), 有 


» Os。 


(3-43) 


(3-44) 


(3-45) 


(3-46) 


(3-47) 


Hl[x’ ACE 一 五 LA 十 GD) 一 0 


代 人 式 (3-47) ,可 得 


Ox C47) st) (3-48) 
3 


Hlx’ (G7)ACGF) Wu tj] 一 一 
于 是 证 明了 和 定理 3-2 中 的 结论 纪 ，。 
当 妇 固定 时 ,根据 定理 3-1 中 的 式 (3-6), 有 
H[x’ (CD (一 五 [CC (7)) 
在 上 式 中 代入 式 (3-42), 得 
Hix’ (0),A (Du (1) ,j= HLx’ (FA Cu tr) 二 NGC) 一 CN) (3-49) 


将 式 (3-45) 从 至 tj 积分 ,可 得 

7 一 (CD 一 一 | dr (3-50) 
.由 式 (3-49) 及 式 (3-50) 得 / 
Hx (OAC uu C0), 1=HLx’ (tr AGE) GD 一 | 


从 而 证 明了 定理 3-2 中 的 结论 @@)。 

比较 定理 3-2 与 定理 3-1 可 见 , 时 变性 并 没有 改变 极 小 值 原 理 中 的 正则 方程 、 横 截 条 
件 及 极 小 值 条件 , 但 却 改变 了 哈密 顿 函数 在 最 优 轨 线 末端 的 值 以 及 沿 最 优 轨 线 的 变化 律 。 
当 tj 自由 时 ,定常 系统 的 蛤 密 顿 淆 数 在 最 优 轨 线 末端 的 值 为 零 ; 时 恋 系 统 的 哈密 顿 函 数 
在 最 优 轨 线 未 端的 值 由 式 (3-48) 确 定 。 当 疙 固定 时 ,定常 系统 哈密 顿 函数 沿 最 优 轨 线 的 恋 
化 律 保持 为 常数 ;时 变 系 统 哈密 顿 函 数 的 变化 律 由 式 (3-51) 决 定 。 

应 当 指 出 ,哈密 顿 葡 数 的 上 述 结论 是 一 个 重要 性 质 ,在 求 最 优 解 过 程 中 经 常 使 用 ,但 
还 个 是 最 优 控制 的 必要 条 件 。 具 体 说 ,对 于 定常 系统 , 当 刀 自由 时 ,定理 3-1 中 的 前 三 个 结 
论 和 结论 多 中 的 式 (3-7) 是 必要 条 件 ; 当 zj 固定 时 ,定理 3-1 中 的 前 三 个 结论 才 是 必要 条 
件 ,结论 也 中 的 式 (3-6) 可 作为 验算 方程 。 对 于 时 变 系统 , 当 1j 自由 时 ,定理 3-2 中 的 前 四 
个 结论 是 必要 条 件 ; 当 tj 固定 时 ,定理 3-2 中 的 前 三 个 结论 是 必要 条 件 ,结论 人 @ 也 仅 作 为 
验算 方程 。 

(2) 对 于 积分 型 性 能 指标 问题 的 推广 

当 性 能 指标 取 为 积分 型 指标 时 , 极 小 值 原 理 的 有 具体 形式 如 下 。 

定理 3-3 对 于 如 下 定常 系统 、 积 分 型 性 能 指标 .未 端 自由 、 控 制 受 约束 的 最 优 控制 
问题 


9GH(x,A,u,T) 
一 一 一 一 dr 


本 二 (3-51) 


min J (wu) 一 | [zc ,W(t) jdz 
ut)EN to 


St. xX)=fx su), x(to)=xro 
i€E [tostjj，z 未 定 
假设 同 定 理 3-1。 若 u" (1) 和 zi 是 使 性 能 指标 取 最 小 值 的 最 优 解 ,x* (1) 为 相应 的 最 优 轨 
线 , 则 必 存 在 二 维 向量 函 数 4 ( ,使 得 w* (2)、x* (1) .ty 和 4 (4) 满足 如 下 必要 条 件 ， 
CU x(t) 和 4 (2) 满 足下 述 正则 方程 ， 
6] 。 


Xf) = 
oH 

A (1) = x 

式 中 哈密 顿 晒 数 为 
HlxoA ,uu)=L x uu) tA CF ED) 
@) xG) 和 4 (G) 满 足 边 界 条 件 
X(to) = xo 
A (1/)=0 


@) 哈密 顿 函 数 相 对 最 优 控制 取 绝 对 极 小 人 
Hlx’ (GG),AG), wu’ (2) = min HLx° (1) ,A (1) ,u(t) | 
4 在 最 优 轨 线 未 跨 哈 密 顿 国 数 应 满足 ， 
当 刀 国定 时 
Hlx’ (ACE CD | 一 万 LA) (9) ] 一 const 
当 tj 目 由 时 
五 Li) ACE (1) 1=0 
证 明 引信 新 的 辅助 变量 zo, 使 其 满足 
zolt)=L Lx) ECGD) zolto)=0 


za) 一 | ZIxzGD)y EEC) ld 


zo (£7) =| L[xC) u(t) Jdt=J (0) 
构造 增 广 向 量 

 ) 四 L(x, 

z= | Fw = (x | 


f(x,u) 
_ 0 _ 
z(t)=| | = 
Xo 


则 原来 的 定常 系统 、 积 分 型 性 能 指标 问题 可 化 为 如 下 定常 系统 、 末 值 型 性 能 指标 问题 ， 


def “一 
min J (Wu)=Zzo(t)—9 x (ty)j 
utt)En 


st. XUEu), X(t)=x, 


必 


Ao l(t) 
A | 
式 中 4 人) 为 辅助 协 态 变量 。 对 于 问题 式 (3-52) ,构造 哈密 顿 函 数 
五 [YY(GD ,MG) ,uC =A CF xr,u) 
~—AL(x uA (Gf ED) 
=— Ho x(t) ,A (Ct) ,ut) AL ,nu) 


iD)=| 


式 中 
Ho xC2) ,A GG) uu |=A CG) FLxG) ,uC) | 
。62 。 


(3-52) 


(3-53) 


(3-54) 


(3-55) 


根据 定理 3-1 ,问题 式 (3-52) 的 协 态 方程 为 


i HA sl) 
dx 
代入 式 (3-53) 及 式 (3-54), 得 
aH 0 
[> |- 9 Xo 站 
CE 本 3H 2 XA ,Wt) 
ox ~ 
因而 有 
AMu(t) 一 COnst 
1 (站 一 一 24 ,UL ) 
Ox 
再 由 定理 3-1 的 横 截 条 件 可 得 
~ qz 人 tr)] 
ACEr) 一 了 过 (7) 
也 有 即 
9 xt) ] 
~ 9 zolty) 网 
A (tr) a gl x (ty) 0 
dx(ir) 
从 而 得 
M(t7)=1 
A (1t:)=0 


因而 定理 3-3 的 结论 名 得 证 。 
由 式 (3-56) 和 式 (3-58) 可 知 
/ Ai) 一 Mtr) 一 ] 
于 是 式 (3-54) 变 为 
HOxsA UL Ou) HA GF xu) 
对 于 原 问 题 ,定义 哈密 顿 消 数 


def— 一 一 
| 0) 一 (YA 8) 一 ZX 十 4 (Gf Cr,u) 


由 定理 3-1, 有 
DA 
5O=| |- DDN L(x,u) 
9A 
因此 
Xo(t)=L(x ,nu) 
.,、_9H 
(1) = 


租 将 式 (3-61) 代 人 入 式 (3-57) ,得 


(3-56) 


(3-57) 


(3-58) 
(3-59) 


(3-60) 


(3-61) 


(3-62) 


(3-63) 


ee 03 。 


aH 
pp | (一 一 可 


于 是 定理 3-3 的 结论 也 得 证 。 
由 定理 3-1 的 极 小 值 条 件 , 则 问题 式 (3-52) 的 极 小 值 条 件 应 为 
H(x’ ,A ,nu’ )= min Hx ,A,u) (3-64) 
将 式 (3-61) 代 入 式 (3-64) ,得 极 小 值 条 件 为 
Hlx’ Au )= min Hx ,A ,Ud) 
于 是 定理 3-3 的 结论 @@ 得 证 。 
由 定理 3-1, 问 题 式 (3-52) 的 哈密 顿 葡 数 (3-54) 在 最 优 轨 线 的 末端 应 满足 : 
当心 固定 时 
Hl[x’* GAU G0) =HC (ACG) Cr 一 const 
当 刀 上 和 目 由 时 
Hlx’ GQ}),A (ED (tf)]=0 
代入 式 (3-61), 可 得 相应 的 
H[x’ CA uu (=H[Ex’ (G7),A G7) du (1) 1=const (3-65) 
以 及 
五 [和 (AGED CD) 一 0 (3-66 ) 
于 是 定理 3-3 的 结论 由 得 证 。 
定理 3-3 表明 ,积分 型 性 能 指标 改变 了 哈密 顿 函 数 的 形式 ,如 式 (3-61) 所 示 , 而 末 值 
型 性 能 指标 对 应 的 哈密 顿 函 数 则 如 式 (3-3) 所 示 , 两 者 是 不 同 的 。 
不 难 验 证 , 石 取 复合 型 性 能 指标 


TD) =—gx Gn)]+| Lorn)di (3-67) 


相应 的 哈密 顿 晃 数 为 
HOGA WD) =L OD +AD FD) | (3-68) 

与 积分 型 性 能 指标 时 一 样 。 可见 ,性 能 指标 中 的 末 值 项 9Lx(tz)] 并 没有 反映 在 哈密 顿 函 数 
之 中 。 因 此 ,不 论 是 复合 型 性 能 指标 ,还 是 积分 型 性 能 指标 ,抑或 是 末 值 型 性 能 指标 ,其 哈 
密 顿 函数 的 统一 形式 应 为 式 (3-68) 。 这 一 形 式 对 积分 型 性 能 指标 自然 不 会 改变 ,就 是 对 于 
末 值 型 性 能 指标 ,由 于 工 (x,z) 一 0, 因 而 式 (3-68) 自 动 演化 为 式 (3-3) 。 

比较 定理 3-3 与 定理 3-1 可 知 , 若 在 性 能 指标 中 包含 末 值 项 gLx(y)], 则 相应 的 横 截 
条 件 应 为 


9 xt) | 
9x(ty) 


A (#1/)= 
否则 
Ar) 一 0 
办 此 ,未 值 项 虽 不 影响 哈密 顿 函 数 的 形式 , 却 会 影响 横 截 条 件 的 形式 , 且 由 定理 3-2 知 ,在 
时 变 情 次 下 ,未 值 项 还 会 影响 哈密 顿 函 数 在 最 优 轨 线 末 端的 值 。 
例 3-2 设 一 阶 系统 状态 方程 
Zi 一 Zi 一 zi， Z(0) 一 5 


。64 。 


式 中 控制 约束 
0. 5<x Li 入] 


试 求 使 性 能 指标 
7=| Fx) Fault) Jdz 


为 极 小 值 的 最 优 控 制 u* (2) 及 相应 的 最 优 性 能 指标 .7* 
解 ” 本 例 为 定常 系统 、 积 分 型 性 能 指标 、iy 辕 定 和 末端 和 由 有 的 最 优 控制 问题 。 由 
定理 3-3, 取 哈密 顿 函 数 
盏 一 Z 十 xz 十 AZ 一 直 ) 一 (十 4 十 zC1 一 分 ) 
由 于 五 是 z 的 线性 函数 ,根据 极 小 值 原理 知 ,使 哈密 顿 孔 数 绝对 极 小 就 相当 于 使 性 能 指 
标 极 小 ,因此 要 求 wu(1 一 办) 极 小 。 由 于 的 取 值 上 限 为 1, 下 限 为 0.5, 故 取 
] ， 当 4] 时 


“ 10 5 当 4 二 1 时 
由 协 态 方程 
4D = 一 = 一 一 [1 十 4(4)] 
其 解 为 
At 一 ce 一 一 ] 
由 横 截 条 件 


A(1)=ce '—1=0 
求 得 c= 二 e。 于 是 协 态 为 
At 一 e ‘—1 
显然 , 当 AGD) 王 1 时 ,zx (2) 产 生 切 换 ,其 中 为 切换 时 间 。 不 难 求 得 t, 二 0. 307 , 故 最 优 控制 


1 ， 0 妈 上 一 0. 307 
2 (ft ) 一 
0.5， 0. 307 委 大]1 
将 wu* (2) 代 入 状态 方程 ,得 
X(t)—1,， Ot 过 0. 307 
(1) = 
X(t)—0.5, 0.307 过 上] 
解 得 
cie“ 十 1， 0<L<<0. 307 
X(t) 一 
ce 十 0.5， 0.307 近 上 委 ] 


代入 初始 条 件 zx(0)=5, 求 出 cj 二 4, 因 而 
T (1 一 4e' 十 1， 0 过 上 < 0. 307 
在 上 式 中 , 令 疆 0.307, 可 以 求 出 0.307&t1 时 z(o) 的 初始 条 件 
Z(0. 307) 一 4e" 3 十 1 一 6. 44 
从 而 解 得 c,= 二 4. 37。 于 是 ,最 优 轨 线 
,= 0&t<0. 307 
4. 37e: 十 0. 5， 0. 307 志 1 志 ] 
本 例 最 优 解 曲线 如 图 3-2 所 示 。 


* DD * 


A() 将 求 得 的 xz" (和 zx” () 代 入 ,得 最 优 性 能 指标 


1.72 1" =| [Lz (+u’ GD]d 
=| et2)dzt| (4. 37e:+1)dt=8. 68 
i 0 0. 307 
例 3-3 设 一 阶 系统 状态 方程 为 
Et 一 一 和 Ci 十 xz)， TX(0)=10 
性 能 指标 


如 .9 上 一 一 一 
7 > J= 卫 | [z(t (0) dt 
x*(f) j 如 果 
| @ u(t) 无 约束 。 
\ 加 (4) 的 约束 为 ; |u(t) | 过 0. 3。 
90.307 ] 试 求 最 优 控 制 w* (4) ,使 性 能 指标 J 为 极 小 值 。 
图 3-2 例 3-2 的 最 优 解 曲线 解 ” 本 例 为 定常 系统 、 积 分 型 性 能 指标 .tj 固定 
和 末端 自由 的 最 优 控制 问题 。 令 哈密 顿 郴 数 
H = (z+) 十 A( 一 zt) 
l 2_ 上 2 1 2 
一 了 7Z A pA 十 7 (zx 十 4) 
(QD w (2) 无 约束 时 。 根 据 定理 2-11, 极 值 条 件 为 
wth=0, u' (0 一 一 1 
由 正则 方程 
= 一 二 一 zx 十 
z 一 一 一 x 一 4 
整理 得 
(ft) =27(t) 
解 出 
(ti 一 cie "+ce 7Y2: 
由 横 截 条 件 及 初始 条 件 


A(1)=0, 7x(0)=10 
求 出 cj 二 0. 1 ,cs=9. 9, 故 最 优 轨 线 
z xz"*(1)=0.1le"’?:!:+9.9e "2! 
最 优 控制 
u’ (1)=0.24e"?—4.1le™?’ 
最 优 性 能 指标 
1 =3| [x**() Fu" 0) Jdt=18. 4 


。66 。 


@ u(t) 有 约束 时 。 根 据 定理 3-3, 由 极 小 值 条 件 得 最 优 控制 


一 已 . 3 ， /0. 3 
zx (ti) 一 一 0. seooi-| [14 委 0. 3 
0. 3， /< 一 一 0. 3 


各 >0.3, 有 达 三 一 0.3, 解 出 
Ai) 一 一 0.587e' 十 5. 15e 一 一 0. 3 
zx’ (1)=10. 3e ‘—0.3 
令 A(1) 二 0.3, 求 出 1 一 0. 914. 
当 0. 914 志 1 夺 1, 有 "= 二 一 4, 解 出 
A(t)=—0.296e"? ‘十 5. 0le 2! 
x’ (1t)=0.123e "+12. 094de™*?! 


于 是 得 
| 一 0. 3， 0<1t<0. 914 
OO 2 ?一 5.0le-72， 0.914<i<1 
fo.se 一 一 0.3， 0<t<0. 914 
OO-1 “2 :十 12. 094e- “i:, 0. 914 委 上 雪 1 


(3) 对 于 末端 约束 问题 的 推广 

前 面 讨 论 了 末端 自由 问题 的 极 小 值 原 理 。 但 是 ,不 少 最 优 控 制 问题 具有 目标 集约 束 条 
件 , 因 此 需要 把 极 小 值 原理 的 原始 形式 推广 到 有 末端 约束 的 最 优 控制 问题 ，。 

设 有 定常 系统 ,其 未 态 x(ty) 受 到 如 下 等 式 目标 集约 束 : 

pLx(t) |=0 (3-69) 
式 中 
"2 ACIDIACION I EACIOND RL 

表示 7 维 癌 量 肾 数 , 其 各 元 都 是 连续 可 微 的 。 若 性 能 指标 中 含有 未 值 项 , 则 rn ;否则 ,rn。 

与 末 闻 自由 问题 不 同 的 是 ,现在 要 求 末端 状态 x(ty) 只 能 落 在 式 (3-69) 所 规定 的 目标 
集 上 。 处 理 这 种 约束 条 件 下 的 泛 旺 极 值 问 题 ,可 引入 拉 格 朗 日 乘 子 7 ,7 €E R', 将 末端 约束 
化 为 等 价 的 末 值 型 指标 项 。 若 原来 的 性 能 指标 为 末 值 型 


J = qx) (3-70) 
则 考虑 末端 约束 (3-69) 的 等 价 无 约束 末 值 型 指标 为 
T=Adxt) =GAx +7 gx (3-71) 


式 中 乘 子 向 量 7Y 待定 。 

不 难 发 现 , 当 末 端 约束 条 件 (3-69) 得 到 满足 时 ,性 能 指标 泛 函 (3-71) 与 原来 的 性 能 指 
标 泛 函 (3-70) 是 相等 的 。 因此 ,可 用 等 价 的 未 值 型 性 能 指标 (3-71) 去 代替 自由 末端 情况 下 
的 Lx(ti)j, 从 而 完全 符合 定理 3-1 的 应 用 条 件 。 

根据 定理 3-1 ,在 有 末端 约束 条 件 下 的 横 截 条 件 应 为 


ay [x(t7)] 
9xX(tr) ox(ty) 十 Ax(ty) ’ 


而 定理 3-1 的 其 他 条 件 不 变 。 于 是 ,可 将 定常 系统 存在 末端 约束 时 的 极 小 值 原理 归纳 


es 人 7 。 


(3-72) 


如 下 。 

定理 3-4 对 于 如 下 定常 系统 . 末 值 型 性 能 指标 .未 端 受 约束 和 控制 受 约束 的 最 优 控 
制 可 题 

min J (u) = x (ty) 
st (1) XC) 一 f(xyu), x(o)=xo， tE€E[toytyjyts 未 定 
© ylxlt)|=0 

式 中 假设 同 定理 3-1,ij 是 状态 轨 线 x(2) 与 目标 集 g Lx(z)j]==0 首次 相遇 的 末端 时 刻 。 若 
& (ty) 和 坟 是 使 性 能 指标 取 最 小 值 的 最 优 解 ,x" (2) 为 相应 的 最 优 轨 线 , 则 必 存 在 非 零 常 
向 量 Y 及 nn 维 向 量 函 数 A4 (4) ,使 得 GD 和 4 (满足 如 下 必要 条 件 ， 

QD x(t) 和 A (2) 满 足下 列 正则 方程 ， 


(1) 二 
A (= 一 5 
式 中 哈密 顿 酒 数 
HOlxA ED) 一 ACE)FCr uu) 
@ x*(G 和 4 (2) 满 足 边界 条 件 
X(to)=~xo 
yg lx) 一 0 
WD + 7 
式 中 后 两 个 条 件 表明 末端 状态 x(zty) 要 落 在 目标 集 上 ,以 及 在 最 优 轨 线 的 末端 协 态 向 量 
A (zy) 横 截 于 目标 集 。 


@) 哈密 顿 汪 数 相 对 于 最 优 控 制 取 绝 对 极 小 值 
H[x’ (0) ,4 CD CD] 一 min HLx* (2/) ,4 (0) ,ube)] 


在 最 优 轨 线 末 端 哈密 顿 函数 应 满足 : 
当 ty 固定 时 
Hlx”* (DAC CD 一 [LGA (7) su’ (#7) |=const 
当 ty 自由 时 
Hlx* CGF),ACG) CD) 一 0 
对 于 时 变 系统 ,末端 约束 一 般 表示 为 
glx(ts) ,tl=0 
这 时 ,等 价 的 末 值 型 性 能 指标 为 
Su)=Gx Cr) t= Gr) ttYT YLxte) ,ts] (3-73) 

因此 ,定理 3-2 中 凡 包 含 9 及 其 导数 的 地 方 , 都 要 以 2 相应 地 替代 ,从 而 有 


opLxlti) ti] dGx(ty) ,ts] 4 9 [xliy) ,ty | 


4 (£7) = ax(ts) 9axt(ty) 9 x(ty) 


7 (3-74) 
以 及 
。68 。 


[zt ,A G7) mu (G7), ] 


_ 9x (1 ) ,ti | 

Qt | 

_ 9x (WO) yr ag [Lx* (7 ) ,7 | (3-75) 

aty aty 
而 定理 3-2 中 的 其 余 各 条 件 均 不 变 , 于 是 ,可 将 时 变 系 统 存 在 末端 约束 时 的 极 小 值 原理 归 
纳 如 下 。 
定理 3-5 对 于 如 下 时 变 系统 、 末 值 型 性 能 指标 、 林 绩 受 约束 和 控制 受 约束 的 最 优 控 

制 问 题 : 


Min J Cw) = Lx) ty) 
st、 OO XQ) Ux)=xo, 1E€E[ioytiy]， ti 未定 
© ylx() ,t=0 
式 中 假设 同 定 理 3-1,ij 是 状态 轨 线 x() 与 运动 自 标 集 y [xbiy) ,tyj]= 二 0 首次 相遇 的 末端 时 
刻 。, 若 u(t) 和 纪 是 使 性 能 指标 取 最 小 值 的 最 优 解 ,x* (2) 为 相应 的 最 优 胃 线 , 则 必 存 在 非 
零 常 癌 量 Y 入 维 向 量 孙 数 A (1) ,使 得 ww G2)、x* G2) .tj 和 A (满足 如 下 必要 条 件 : 
CD x(#) 和 4 (z) 满 足下 列 正 则 方程 : 


£0) 


DA 


aa 
A (全 二 一 可 


式 中 哈密 顿 函 数 
HlxsA ut)—=A (fF x, Et) 
@ xD) 和 A (满足 边界 条 件 
X(to) 一 0 
ylxlti) ,tl=0 


odxlti) ,tt og [z(ty), tr 
MD ret) + dr) 7 


式 中 后 两 个 条 件 表 明 末 态 xi) 要 落 在 运动 目标 集 上 ,以 及 在 最 优 轨 线 的 末端 协 态 向 量 
A (tr) 横 截 于 运动 目标 集 。 
(3) 哈密 顿 隔 数 相对 最 优 控制 取 绝 对 极 小 值 
Hlx: (1) ,A (1) mu” C(t) ,t | 二 min HLx° (1) ,A (1) ;W(t) ,t | 
了 在 最 优 轨 线 未 癌 蛤 密 顿 蚂 数 应 满足 
Hlx’ G7),A CG ) ,uu (7),t? |=— 
3) 治 最 优 轨 线 哈 密 顿 函数 变化 律 
H[x* (AC a 5 =HEx GO AG CD — | 


(4) 对 于 复合 型 性 能 指标 问题 的 推广 
根据 扩充 变量 的 方法 ,可 以 导出 时 变 系 统 、 复 合 型 性 能 指标 情况 下 的 极 小 值 原理 。 为 
了 简单 起 见 , 只 考虑 4y 自由 及 末端 自由 的 情况 。 


ox GF) or op Lx” (7 ),t} | 
57 


9 


roH(xr,A,u,T) 


Adar dr 


+ 69 。 


定理 3-6 对 于 如 下 时 变 系统 、 复 合 型 性 能 指标 、 末 端 自由 和 控制 受 约束 的 最 优 控制 
问题 ， 
min TO) =—Ix CD) t+ | Lorsmt)dt 


ut) EN 
Ss.t. X(t)—= fxsut), YX(to) 一 Xo (3-76) 
i:€E [to,ttj]， 自 由 
假设 同 定 理 3-1。 若 u(t) 和 zi 是 使 性 能 指标 取 最 小 值 的 最 优 解 ,x (z) 为 相应 的 最 优 轨 
线 , 则 必 存 在 维 向 量 隐 数 4 (1) ,使 得 wu" (2)、x* (2) .zt 和 4 人 G) 满 足 如 下 必要 条 件 ， 
QD x(t) 和 4 (满足 下 列 正 则 方程 : 


,9H 
(ft) 一 | 


aH 


A (所 一 一 本 


式 中 哈密 顿 晒 数 
T(xsA su 一 天 (Et 十 ACE) FOX ,t) 
x(t) 和 4 (2) 满 足 边界 条 件 


xlto) 一 龙 0 


aq x(ty) ,ty 


人 tr) 一 3X) 


@) 哈密 顿 函数 相对 最 优 控制 取 绝 对 极 小 值 
Hix’ (1),A(t),u” (1) t= min HLx* (1) ,A (1) ,u(t),t | 


在 最 优 轨 线 末 端 哈密 顿 葡 数 应 满足 
Hlx’ (24°) ,MCF) mu’ (7) ,tt |= 
证 明 引入 新 的 辅助 变量 
zolt) =1, z=) Ler td 


oadx’ (£7 ) ,tt} | 
5 


使 其 分 别 满足 
Zolt)—=1, zolto)=to, Xolty)=iy 
以 及 
Qt 一 YU rarilto)=0 
zn le) =| Lou dt 
构造 增 广 回 量 


To 人 () ] 
x(t)= 号 | ， fx,u)= je 
n+1(t) (XxX,u,t) 


to 

x(to) = = ~ xo (3-77) 
0 . 

ea 7 人 。 


xt7) |=d x ty) ,To (tf) |) 二 x, 《和 


(3-78) 


则 原来 的 时 变 系 统 、 复 合 型 性 能 指标 、ty 自由 和 和 末端 自由 问题 式 (3-79), 可 以 化 为 如 下 和 是 


党 系统 .未 值 型 指标 . 姑 目 由 和 末端 上 自由 问题 . 
min J=G x(t) | 


H(t)E 0 


st. 大 (人 一 下 (ee) ， Kt) =x 


A (L) 
一 | A (zz) | 
A, +1 (1) 


式 中 h(t) 和 41() 为 辅助 协 态 变量 。 对 间 题 式 (3-79) 构 造 哈 密 顿 函数 
HELxC(2) ,A C0) uC) | =A GF x,u) 
=AC)TFA GF Crust) A, Lx uu,t) 
将 定理 3-1 应 用 于 定常 问题 式 (3-79) ,根据 协 态 方程 (3-2) 
CA ,WU) 


必 


dx 
代入 式 (3-80) 式 (3-81) 和 式 (3-77) ,得 
aH 一 
DT _9H 
ACE) i dt 
0 - -2 -| 3 万 
ox 一 二 一 
+1(£) oH ox 
Do 
因而 有 
A (= 一 全 
M+1(t) =const 
上 硝 由 定理 3-1 的 横 截 条 件 
a x(ty)] 
A (tr) ax(t;) 
可 得 
9 
一 一 一 一 DCtr) ,ty] 
~ Ao ty) 0 0 
|; (£7) - yx 一 OA x(t) ,ty | 
9x(ty) 
+1(t7) D9 1 /7 
9 Tatilts) 
因而 有 


0) est] 


(3-79) 


(3-80) 


(3-81) 


(3-82) 


(3-83) 
(3-84) 


(3-85) 


sy 了] 。 


4 4D = 人 
ATCEr) 一 1] 
由 式 (3-86) 知 ,定理 3-6 中 的 结论 包 得 证 。 
将 式 (3-84) 和 式 (3-87) 代 人 式 (3-81) ,并 记 
HlxCG) AG) wu) ,t= ut) A (CE EE) 
可 得 
HLx(C() ,MC ud) = Hx CG) ,A CG) ,u(t) ,+ 
于 是 , 式 (3-83) 可 改写 为 


__9H__3aH 
A (ti) 一 一 5 一 一 本 
而 定理 3-1 中 的 状态 方程 
(1) 一 
代 人 式 (3-80) 、 式 (3-81) 及 式 (3-89) ,得 
aH 
zolt) 9 l 
Tat1(l) 3 瑟 (x su,t) 
可 Ai 
由 式 (3-91) 知 
(1) = 全 


式 (3-92)、 式 (3-90) 及 式 (3-88) 表 明 , 定 理 3-6 中 的 结论 人 成立， 
根据 定理 3-1 的 极 小 值 条 件 ,问题 (3-79) 的 极 小 值 条 件 应 为 
H(x’* ,从 下 ) 一 min Hx" ,A 下) 
代 人 式 (3-89) ,上 式 可 写 为 


Hlx’ (1) ,A Cu CD) 十 (一 min HLx° (1) ,A (1) ,u(t) ,tT A(z) 


于 是 得 


Hlx’ GAGE CD) 一 min HLx* (£2) ,A (1) ,u(t) ,| 


从 而 证 明了 定理 3-6 中 的 结论 @。 
由 于 ty 自由 ,根据 定理 3-1 中 的 式 (3-7), 有 
Hl[x’* CG) ,A ) nu’ (1*)1=0 
因为 z 


Hlx’ (te) ,ACF ) 8 (7) =HEx CG) A ) wu (ty*) ,ty I HAG ) 


而 由 式 (3-85) 知 


a ~ (fr) ff 
Wt ) = Et) 5 7 


故 得 
Hlx’ G}) ,A (7) nu’ G7) ,82 1= — Es 
了 
0 


(3-86) 


(3-87) 


(3-88) 


(3-89) 


(3-90) 


(3-91) 


(3-92) 


从 而 证 明了 定理 3-6 中 的 结论 和 由， 
为 了 便于 应 用 , 表 3-1 和 表 3-2 分 别 给 出 了 各 种 具体 最 优 控制 问题 的 极 小 值 原理 的 
形式 ,以 供 查 阅 。 
表 3-1 定常 系统 极 小 值 原 理 


末 映 时刻 性 能 指标 ” 床 端 状态 | ”正则 方程 版 小 值 条 件 边界 条 件 五 变化 律 
.oF 
x 二 全 


H*(t)=H?* (1/) 


一 COmSt 


Xlto)—=xosp tl x(tr) |=0 
op x2)] H'*‘t)=H"* (ty) 


H=Al()f x, 
一 COnst 


dx |, 


Air) 一 + 


党 了 
< 
rlto)—= Xo Xt) = x 
ER (A (未 知 ) 
性 
上 
‘oe X(to) = Xo H"* ~—=H* (ry) 
< 
一 COnSst 
个 X00) =xo,p Lx) =0 
TE 


H= L(x,u) 
ATC2) flxsu) 


J=A xr) | 
H* (2)=H* (ty) 


+ |{L ord X(t0) xorg [x(t7) 1=0 
0 


— const 
A (17) = | + 
H* (tt})=0 
= x(tr) | 
H=A (fr, H* (8)=0 
局 
n X(to)— xo Xt/ — x 
站 CAG/) 未 知 ) 
个 
日 由 | 7 一 | ccd Xlio) 一 2 0 
， < H* (1})=0 
全 人 (tr 一 站 
个 ro =x Ir]=0 
T 
~ 40 一 | 玫 ，| 
x J 
H=L(x,wu) + x(to) =xo 
J=Gx(t) |] AT(A) fx ED) 4 (#7) = 99 
可 
IC H'* (8)=0 


x(to) 一 Yo 区 [Yir) |=0 


~| 9p.99 
A (z7) | + ， 


i 
+| YY ED 
to 


。73 。 


表 3-2 时 变 系统 极 小 值 原理 


._3H 
YX aA 
了 五 


4 一 一 5 


x(to)=xo$ Lr) ,tJ=0 aH 
op ay 34 | aH 
) 和 六 (ti )= | 区 十 了 

ust) ~ , 

3 

= x(fo0)—=xXo, Xt) ry 

| 

(A (ty) 未 知 ) 

性 H* (1) 

2 To) x =H"* (7) 

< A (tr)=0 Ff J 

EE Xlto) = xo,y [xCtr), tf |=0 : Or 


a 
A (7) = EE 


万 ” 


H=L(x,u,t) 
+ AT() fx,u, 


J—q rx) ,tr 


Xfo)=xosp Lxlt7) ,tr 一 0 
A (tr)= | 强 + 芝 2 


X(to)— Xo 


十 | /Lr ,dt 
io 


ty 


HC;)=— < 


gg 9tr 


dx(tr) 
x(to0)=xo,p Lx(t7) ,tr]=0 


A (tf) = 


J=x(tr) ,ty 


H"' (ty )= 


H=A C0) f(x, _ [fap ay -| 加 ro | 
ut) ~ 4G) = | 32+ a tt ae ey 
3 
~ X(t0) = xX0 Xt/) = x 
a 五 ”tr )=0 


(AGEr) 来 知 ) 


tf 上 自由 J=|7Zooapd 计 人 一 0 
, = 
ee 
E xlto)=xo,p lx) ,t=0 ) 
中 T 
4 9 ay 
x A (tf) = x 一 一 条 


H=L(x,u,t) 
Ai) Ff Cx,u, 
t) z 


= .xt7) ,Ef 


‘Ff 
+| L(x sr 
0 


H"* (tr)= 


1a,,93y 
| 2+ at | 


例 3-4 设 军 宙 飞 船 登 月 舱 的 质量 为 m.(2) ,高 度 为 h() ,垂直 速度 为 v() ,发 动机 推 
力 为 u(z) ,月 球 表面 的 重力 加 速度 为 常数 8, 不 带 燃 料 的 登 月 舱 质量 为 M ,初始 燃料 的 总 


质量 为 f。 已 知 登 月 舱 的 状态 方程 为 
h(t)=v(t), hh(O0)=h, 


》 一 一 & 十 二 CU ， YY(C0) 一 pp 


Mm(t)=—ku(t), m(0)=M+F 
。 74 。 


要 求 登 月 舱 在 月 球 表面 实现 软 着 陆 , 即 末端 约束 为 
p=h(tt)=0 
J =p (ty) 二 0 


发 动机 推力 ul) 的 约束 为 
ut) EN, Q={uG) 10RuG)Sa}, ViE€Elo0,t] 
试 确定 最 优 控制 & (2) ,使 登 月 舱 从 已 知 初 态 转 移 到 要 求 的 目标 集 ,并 使 登 月 舱 燃 料 消 耗 
jy 一 一 Mt tr) 
为 最 小 值 。 
解 ”本 例 为 时 变 系 统 . 未 值 型 性 能 指标 , 乡 自由 和 末端 约束 的 最 优 控制 问题 、 由 表 3- 
2 ,构造 哈密 顿 函 数 


H=NACOFAD mg OOo) A, (tku tt) 


二 
式 中 尺 《2) ,加 (和 (2) 为 待定 的 拉 格 朗 日 弱 子 。 根 据 题 意 
p= —m(tr) 
由 协 态 方程 
人 (1) 一 一 = 天 | 
4) = 一 人 一 一 (1) 
aH 
(= uC) 
由 横 截 条 件 
99 gy 
An (#7) = gh 9h hy” 二 7 
99 9 yg, 
(ti) = Av (iy ve aveY ) 一 /2 
A (tr 一 5 一 一 1 
式 中 7X 和 7Y, 为 待定 的 拉 格 朗 日 乘 子 。 
将 哈密 顿 函数 整理 成 


H = Cv 一 hg) 十 [说 A 
由 极 值 条 件 , 石 相对 wu* 到 绝 对 极 小 值 ， 因此 ,最 优 控 制 


0, 当 全 一 0 


nu” (1) = 
0， 当空 一 As>>0 
上 述 结果 表明 ,只 有 当 发 动机 推力 在 其 最 大 值 和 有 零 值 之 间 进 行 开关 控制 , 才 有 可 能 在 


现 软 着 陆 的 同时 ,保证 登 月 舱 的 燃料 消耗 最 少 。 
例 3-5 已 知 二 阶 系统 的 状态 方程 


“7Y95。 


tt 一 2 ， ZX1(0)=0 

z(t)=u(t), X,(0)=0 
设 末 羡 时 刻 tj 目 由 , 末 并 状态 
: zi (tj) =Z2(tj) 二 六 
控制 约束 为 

lu (lt) 1 志 1 
试 确定 最 优 控 制 w* (4), 使 下 列 性 能 指标 : 
J= | ul )d; 
取 极 小 值 。 
解 ”本 例 为 最 小 能 量 控制 问题 ,可 用 极 小 值 原理 求解 。 根 据 表 3-1 中 给 出 的 定常 系 

统 积分 型 性 能 指标 tj 自由 和 末端 固定 的 问题 的 最 优 解 必要 条 件 ,构造 哈密 顿 函数 


2 
H = 十 和 x 十 Au 二 "十 到 | 十 和 六 一 二 入 


4 
由 极 小 值 条 件 ,最 优 控 制 应 取 
ov (Ci 一 一 地 (0)， 当 |%,(0) |<2 
十 1， 当 (< 一 2 
由 险 密 顿 泪 数 沿 最 优 轨 线 的 变化 律 
H*(t)=H" (tr)=0 
可 得 
2 (0) 十 四 (CO0)zy 40) 十 4(0)2 (0)=0 
以 及 


u(r? ) -十 ACE7 )X> (tr )》 十 At 7 入 《地 ) 一 0 
因为 z; (0) 一 0, 可 以 断定 xz 0) 一 0 否则 ,xz (0) 二 一 和 (0) 与 w* (0) 一 一 于 2(0) 矛 盾 ， 
由 协 态 方程 


oH 
(= 一 5 = 一 (4) 
z 2 
解 得 
A1(#£)=2c1, Mt 一 一 2cit 十 cy 
因 
， 1 
ut (0) 一 一 了 4 必 (0) 二 0 
故 c: 一 0, 于 是 有 


A, (4) 2ct 
对 应 于 ci 的 符号 ,最 优 控制 应 为 


es。 0* 


cf， 当 :二 
Cl 


1， 当 :> 
C1 
或 者 


Cty 二 

C1 

u(t)= 1 
一 上 ， 当 t 污 一 一 

C1 


(3-93) 


(3-94) 


由 所 给 状态 方程 及 初始 条 件 不 难 推 证 : 若 c>0, 即 x(t/) 宝 0, 应 采用 式 (3-93); 否 则 , 采 
用 式 (3-94)。 本 例 已 知 zsGr) 一 1/4, 故 最 优 控制 律 应 取 式 (3-93) 。 显 然 , 状 态 方程 的 解 应 


为 
1 ,; 
Zi 人 一 Ac 9 
] 当 上 去 一 
T(t) = 
或 者 
(i) 一 十- 十 | 
] 当 i> 一 
Tt) =o Tt 
1 
设 解 为 式 (3-95), 代 人 已 知 的 末 态 
立 ] (#7) =z2alty) = 地 
容易 求 得 
tr = 。 一 


正好 满足 妃 委 LI/cl 要 求 , 故 所 设 状态 方程 的 解 是 正确 的 。 
最 后 ,本 例 的 最 优 控 制 为 


:站 一 二 
ww (1)= jst, YiIEL0,3j 


相应 的 最 优 性 能 指标 为 z 
， 人 ,2 1 
J =| + (1)dt 二 训 
最 优 轨 线 及 拉 格 朗 日 乘 子 分 别 为 
] 
TY (ti) 一 一 一 态 Ai (ti) 一 二 
以 及 9 
Te CO 一 3 Nt)=— ot 


3.2 离散 系统 的 极 小 值 原理 


(3-95) 


(3-96) 


随 厦 数字 计算 机 日 益 普 及 ,计算 机 控制 系统 日 益 增多 。 因 此 ,离散 系统 最 优 控 制 问题 


YY 


的 研究 显得 十 分 重要 .其 原因 是 :一 方面 ,许多 实际 问题 本 身 就 是 离散 的 ,例如 ,数字 滤波 、 
经 济 与 资源 系统 的 最 优化 问题 ,其 控制 精度 高 于 连续 系统 ; 另 一 方面 ,即使 实际 系统 本 喘 
是 连续 的 ,但 为 了 对 连续 过 程 实行 计算 机 控制 ,需要 把 时 间 整 量化 ,从 而 得 到 一 离 获 化 系 
统 ,使 得 连续 最 优 控制 中 难以 求解 的 两 点 边界 值 问题 ,可 以 化 为 易于 用 计算 机 求解 的 离散 
化 两 点 边 值 问题 。 

本 节 将 介绍 离散 变 分 原理 和 离散 极 小 值 原理 ,并 对 连续 及 离散 极 小 值 原理 的 结 采 加 
以 比较 。 


3.2.1 离散 欧 拉 方程 


当 控制 序列 不 受 约束 时 ,可 以 采用 离散 变 分 法 求解 离散 系统 的 最 优 控制 问题 ,得 到 离 
散 极 值 的 必要 条 件 一 一 离散 欧 拉 方程 。 
设 描述 离散 系统 的 状态 差分 方程 为 
x(k 二 1)= flx(k) ,ultk),k], k=0,]l,…,N—1 (3-97) 
式 中 x(%) 是 离散 时 刻 & 的 维 状 态 癌 量 ;wuC(8) 是 的 mm 维 控制 向 量 ;f(。) 是 nn 维 向 量 
函数 序列 。 对 于 等 间隔 采样 ,6 二 k 了 ,7 为 采样 周期 ;N 为 数据 窗口 长 度 。 
离散 最 优 控制 间 题 中 ,性 能 指标 取 为 如 下 标量 函数 的 累加 : 


NC—1 


本 SNLEx OR) yuk) sx Ck 1) kh]- 之 /人 (3-98) 


是 一 站 


式 中 六 王 ZEx(CR) ,ulk),x(k 十 1),k] 是 第 个 采样 周期 内 性 能 指标 v 的 增 量 。 
设 式 (3-97) 和 式 (3-98) 构 成 的 离散 最 优 控 制 问题 存 在 极 值 解 , 记 为 x* (&) 和 (RE)， 
则 在 极 值 解 附近 的 容许 轨 线 和 容许 控制 可 以 表示 为 
x(k)=x* (k)+Ox(k) 
me rm (3-99) 
x(k 十 1) 二 x (十 1) 十 0x(k 十 1) 
式 中 6x(k)、6u(&) 和 6x(k 十 1) 分 别 是 x(4)、wu(&) 和 x(4 十 1) 的 变 分 。 将 式 (3-99) 代 入 
式 (3-98) 得 离散 性 能 泛 范 


J 一 >)7L[z (十 xz()a (ED) 十 Gu(E) xz (二 1) 十 Sr 二 1) 有] (3-100) 


二 0 


当 不 考虑 式 (3-97) 所 示 的 等 式 约束 时 ,为 了 求 得 上 述 离 散 拉 格 朗 日 问题 的 极 值 解 ,对 式 
(3-100) 取 离散 一 次 变 分 


aL aL aL 
$= D [本 | ar) + | su 十 | 元 3x (ht1) | (3-101) 


对 式 (3-101) 中 的 未 项 进行 离散 分 部 积分 , 令 & 一 Mi 一 1, 对 求 和 变量 进行 置换 ,得 


一 1 aL 
> ldo] Bx Ck+1) 


PE 


] Bx (mm) 


| 
4 = :i 


— > (202 Dm Dm sm 1) 


Km) Sx Cm) 


当 
| 
© 


es 7T8s 


一 6x(0) 
OX (Cm) m=0 


aLlixCGm—1) ,um—1), xm) ,mCO— 1 | 
二) 


再 令 mm 一 k, 上 式 变 为 


全 [5] CX(R 十 1) 

N 

名 = > (DH) gr 人 
{1 xc0) 

1 2A Dre Ds kL pro) i,, 


今 
7 1=L|lx(k—1) (RO—1) ,XX (Rk) ,k—1| 
将 式 (3-102) 代 入 式 (3-101), 可 得 


51= 5 [t+] ero)+| 


| uC | 


9 Li ] 9 Li ， 
二 | 3 ANCXCA 人 | 32 | 3x0) (3-103) 


令 式 (3-103) 为 零 ,考虑 到 6x(4) 和 6u(k) 是 任意 的 ,可 得 如 下 离散 泛 函 极 值 的 必要 条 件 ， 
aL DLL 

Jax(k) gx(k) 

| aL, 

ou(k) 


一 全 
(3-104) 


一 0 
以 及 
aL, 了 - 97 1] 加 
a | 6x(N)—| 元 | Sx(0)=0 (3-105) 
式 (3-104) 为 回 量 差分 方程 , 常 称 为 离散 欧 拉 方 程 , 而 式 (3-105) 则 是 相应 的 离散 横 截 条 
件 。 知 始 端 固 定 , 即 *(0) 一 xzo, 末 端 自由 , 即 6xCN) 任 意 , 则 边界 条 件 为 


ZrCN 一 DuCV 一 1D),zCN),N-1]_， 
dxCN) 


由 以 上 分 析 可 见 , 离 散 拉 格 朗 日 问题 的 极 值 解 x* (%) 与 wu* (4) 必 须 满足 离散 欧 拉 方 
程 和 横 截 条 件 。 横 截 条 件 的 应 用 情况 可 以 参照 连续 系统 中 有 关 横 截 条 件 的 讨论 。 
当 考 虑 式 (3-97) 所 示 的 等 式 约束 时 ,与 连续 时 间 变 分 法 一 样 ,也 可 以 通过 拉 格 朗 日 乘 
子 函 数 将 等 式 约束 下 的 极 值 问题 化 为 无 约束 的 极 值 问题 。 现 举例 说 明 如 下 。 
例 3-6 设 一 阶 离散 系统 及 其 边界 条 件 为 
Tk 二 1)=r(k)ulg) 
(0)=1, 7x(5)=0 


x(0) 一 点 0， 


性 能 指标 


4 


= Pu:k) 


k=0 


试 求 使 性 能 指标 为 极 小 的 最 优 控制 序列 w* (8) 和 相应 的 最 优 状态 序列 x (4)。 
解 应 用 拉 格 朗 日 乘 子 函数 A(4) ,构造 广义 离散 泛 本 


]. 一 人 [FHA DE rE +k) tuk)] 


则 原 泛 函 在 状态 差分 方程 等 式 约束 下 的 条 件 极 小 间 题 化 为 广义 泛 函 J 的 无 条 件 极 小 问 
题 。 这 时 
有 一 广 2( 人 十 MCA 十 1D)[ 一 (二 1) 十 (AD) 十 &(A) 


1 一 计 2( 一 1) 十 MCA)[ 一 zC) 十 zt 一 1) 十 zx 一 1 


因为 
a J 
9L: 
FE 


所 以 由 离散 欧 拉 方程 (3-104) 可 得 
A(k 十 1] ) 一 A(k) 二 c 
ul(k)=—A(k 二 1)=~—c 
将 w(k) 二 一 c 代入 状态 差分 方程 ,得 
ZX(k 十 1) 二 x(k) 一 ec 
用 迭代 法 求解 上 述 差分 方程 ,有 
X(1)}=7x(0)—ce 
Z(C2) 一 Z(1) 一 c 一 CC0) 一 2c 


TX(k)—=T0)— kc 
代入 已 知 边 界 条 件 :z(0) 二 1,x(5) 二 0, 不 难 解 得 
/ C 一 0. 2 
因此 ,该 离散 系统 的 最 优 控制 与 最 优 轨 线 分 别 为 
U (hk)=—0.2, xz’*(k)=1—0.2k, k=0,]1,2,3,4 
应 当 指 出 ,应 用 高 散 欧 拉 方 程 求解 等 式 约 束 和 不 等 式 约束 的 离散 极 值 问 题 比较 麻烦 ， 
而 用 离散 极 小 值 原理 处 理 这 种 约束 问题 却 很 方便 。 特 别 是 , 当 控 制 序列 受 约束 时 ,离散 变 
分 法 不 再 适用 ,只 能 用 离散 极 小 值 原理 或 离散 动态 规划 法 来 求解 离散 极 小 值 问题 。 有 关 动 
态 规划 的 方法 ,我 们 将 在 第 4 章 介绍 。 


3.2.2 离散 极 小 值 原理 


庞 特 里 亚 金 发 表 极 小 值 原理 时 ,只 讨论 了 连续 系统 的 情况 ,为 了 获得 离散 系统 的 极 小 
值 原理 ,有 人 曾 从 离散 系统 与 连续 系统 比较 接近 这 一 事实 出 发 ,设想 把 连续 极 小 原理 直接 
推广 到 离散 系统 中 去 ,但 除了 采样 周期 足够 小 的 情况 外 ,结果 是 失败 的 。 离散 极 小 值 原理 
的 普 包 论述 比较 复杂 ,证 明 过 程 也 十 分 宛 长 。 为 了 简单 起 见 ,我 们 只 研究 控制 向 量 序 列 不 
及 约束 情况 下 的 离散 极 小 值 原理 ,然后 不 加 证 明 地 推广 到 控制 向 量 序列 受 约束 的 情况 .对 
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离散 极 小 值 原理 详尽 证 明 过 程 感 兴趣 的 读者 ,可 以 参阅 前 办 联 竺 者 P. TABACOB 和 里 . M， 
KMPITJIIOBA 的 著作 《最 优 控 制 方法 》。 
离散 极 小 值 原理 可 以 叙述 如 下 、。 
定理 3-7 设 离散 系统 状态 方程 | 
xlk+1)= fxCk) ,ukR),k|, x0)—=xo 
k=0,],2,.…,N—1 (3-106) 


性 能 指标 : 
NO—] 
J=Gx CN NI > LEx(k) ,uk),&] (3-107) 


式 中 f(，。，)、pgk，。) 和 LC(，) 都 是 其 自 变量 的 连续 可 微 晴 数 ,x(k) ER",u(k) ER”"。 控 制 有 
不 等 式 约束 :u(k)EQ,Q 为 容许 控制 域 。 末 端 状态 受 下 列 等 式 约束 限制 : 

py [xCN) ,NJ=0 (3-108) 
式 中 J (。)ER ,rn。 厅 WwW" (k) 是 使 性 能 指标 (3-107) 为 最 小 的 最 优 控 制 序列 ,x* (%) 是 
相应 的 最 优 状态 序列 , 则 必 存 在 r 维 非 零 常 向 量 XY 和 维 向 量 函 数 A (48) ,使 得 u* (&)、 
XxX”(k) 和 A (&) 满 足 如 下 必要 条 件 : 


CD x(k) 和 4 () 满 足下 列 差 分 方程 : 
9H(&k) 
I(kT1)= ES CE (3-109 ) 
_ 9H(k) 
A (k)O= IxCk) (3-110 ) 
式 中 离散 哈密 顿 函 数 
一 ZE)ECE) RE 十 人 CE 十 1) FLCxCE) uk) ,| (3-111) 
2 x(k) 和 A (%) 满 足 边 界 条 件 
xX(0)=xo , (3-112) 
pj [xCN),N |=0 (3-113) 
_ ondxCN),N] ab[zGCN)，N 
A (MT rN txN)y 7 (3-114) 
(3) 离散 哈密 顿 浪 数 对 最 优 控 制 u* () 取 极 小 值 
Hilx* (k),u’ (ER) (CR 十 1) 
者 控制 变量 不 受 约 束 , 即 uC%) 可 以 在 整个 控制 空间 R” 中 取 值 , 则 极 值 条 件 为 
: 9 已 (R) 
5 一 (3-116) 


和 证明 ”下面 仅 就 控制 &(A) 不 受 约束 时 的 结论 进行 推 证 。 利 用 拉 格 朗 日 乘 子 函数 1 (% 
十 1) 和 XY, 将 等 式 (3-106) 和 式 (3-108) 约 束 下 性 能 泛 随 (3-107) 的 极 值 问 题 化 为 等 价 的 无 
约束 离散 泛 函 极 值 问题 。 

构造 广义 离散 泛 函 


T=GxXCNI NTTYT yx CON, N+ > {Lx Ck) ,uk) ,8k] 
= 0 


2 BB]* 


ATCRHI EF CR ukR) ,Rk)— rk 1)]) 
令 离 散 哈密 顿 晒 数 
HR)=LI xCk) EECR) 到] 十 ACER 十 1)7Lx(R) ,uk),k| 
则 广义 离散 泛 函 可 写 为 
AN 一 1 
7 一 WECN)N] 十 入 用 [ECON)N] 十 之 (HOA (kt Derk+1)) (3-117) 
对 式 (3-117) 中 的 末 项 进行 离散 分 部 积分 , 式 (3- 117) 可 写 为 
J =A x CCN) N+YT yy [x CN),N + 5S (HR)—ATCRIxCER) HAT OXON — A CNIxCN) 
二 一 日 。 


取 一 次 变 分 ,考虑 到 6x(0) 一 0, 可 得 
og xCN) 'N| 99 LxCN) JN | 
dxCN) 9xCN) 


«AIranHck) T a Hk) 1T 
+ >) |[ 守 | CD | x(k) + | Si | Bu(&) | 


令 6J, 二 0, 考虑 到 变 分 6x(%) 和 6x(N) 是 任意 的 ,所 以 由 离散 欧 拉 方 程 及 横 截 条 件 可 得 

a Hk) 

DXIRI) 

a Ny, N| 
xCN) 


T 
5 一 | > CNV) | GxCN) 


A (k)CO— 


ay' [xCN), Ny 


十 oxCN) 


A(N)= 


对 于 


outlk) 


当 w(k) 不 受 约束 时 ,6u(k) 是 任意 的 , 故 必 有 
HE) 
au(k) 


此 外 ,定理 中 式 (3-109)、 式 (3 112) 和 和 式 (3-113) 成 立 是 显然 的 。 
知 离 散 系 统 末 端 状 态 自由 , 则 离散 极 小 值 定理 形式 如 下 ,其 证 明 过 程 与 定理 3-7 
类 似 。 
定理 3-8 设 离散 系统 状态 方程 
Y(R 十 1) 一 FLx(CR) ukE) Ek, x(0)=x, 
k=0,1,2,.…,N—1 


> SF | du(k) =0 


性 能 指标 


式 中 f(。)、p(，) 和 LC(，) 都 是 其 自 变量 的 连续 可 微 函 数 ,x Ck) ER",u(k) ER"。 控 制 有 
不 等 式 约束 :u(k)€ 0,0 为 容许 控制 域 。 末 端 状态 xCN) 自 由 。 若 wu* (%) 是 使 性 能 指标 为 
极 小 的 最 优 控制 序列 ,x* (4k) 为 相应 的 最 优 状 态 序列 , 则 必 存 在 维 向 量 函 数 A4 (&) ,使 得 
z (kk) 、x* 《kk) 和 4 (4%) 满 足 如 下 必要 条 件 、 

(D x(k) 和 A (k) 满 足下 列 差分 方程 ; 


xX(k 十 1) 二 9 Hk) 


94(& 十 1 ) 
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式 中 离散 哈密 顿 肾 数 

Hl(E)=HLx(R) uk), AGRE), R=LI x CE) uk) ,ktA CkR+1) fl x Ek) uk) ,Rk | 

加 x(k) 和 4 (%) 满 足 边 界 条 件 
XxX(0)=xo | 

a xCN)N | 

dx(N) 
@ 离散 哈密 顿 函数 对 最 优 控制 a* (4) 取 极 小 什 

Hlx’ (Rk),u’ Ck),A (k++1) j= min HLx° (R) ,uCkR) ACE 十 1) 到 


看 控 制 变量 不 受 约束 ,有 


A(V) 一 


9 (kD) 
Qu (lk) 
上 述 离散 极 小 值 原 理 表 明 ,离散 系统 最 优化 问题 归结 为 求解 一 个 离散 两 点 边 值 问题 。 
而 对 离散 极 小 值 原理 的 理解 ,与 连续 极 小 值 原 理 一 样 ,使 离散 性 能 泛 函 为 极 小 与 使 离散 哈 
密 顿 画 数 为 极 小 是 等 价 的 。 
例 3-7 已 知 离散 系统 
XT(k 十 1)=rk)+ulk), Z0) 一 0 


性 能 指标 
J 一 >，[z:(R) 十 zx2(R)] 


k= 二 0 


求 使 性 能 指标 达到 极 小 的 最 优 控制 序列 x*(&) 。 
解 ” 本 例 N 二 3, 末 态 <(3) 自 由 ,可 用 定理 3-8 求解 。 令 离散 哈密 顿 函 数 
HR)=z RR) RHACR Ir) u(y) | 


因为 
_9HGE) 
A(k)C— I Zk) 一 2z(&D) 十 4(R 十 ]) 
AH(R) 
J Ck —2wu lk) ACR+1)=0 
393dxCNVN] 
A NN) 0 
所 以 
ub) 二 一 4(k 十 1) 
A(k 二 1)=A(k)— 27r(k) 
印 


ws(0) 一 一 本 MG ) 


xz (1) 一 一 工 1r2) 

2 

1 
w(2) 一 一 亏 M(3) 一 0 


» 83°. 


AM(1) 一 2Lz(C1) 十 工 (2) 


op- 
A(0)=2[7x(0) 二 Xx(1) 十 x(2)] 


由 状态 方程 
zlk+1)—zr(k) uk) 
代 人 
u(0)=—7zx(1)—7x(2) 
Co 
ul(2)=0 
求 出 


z(GD) 一 方 Lz(0) 一 z(2)] 


z(2)= 志 7(1) 


yy 


根据 已 知 的 z(0)= 二 zo, 最 后 求 得 最 优 轨 线 、 最 优 控 制 及 最 优 性 能 指标 为 


3. 2.3 离散 与 连续 极 小 值 原理 的 比较 


离散 系统 最 优 控 制 序列 的 求 取 是 一 个 多 步 决策 过 程 ,在 N 个 采样 周期 中 ,系统 的 状 
态 从 x(%) 到 x(k 十 1) 这 样 一 步 步 地 转移 ,每 一 步 都 有 一 个 控制 四 量 作 用 ,在 最 优 控 制 序列 
u*(k) 作 用 下 ,系统 状态 转移 轨 线 是 最 优 的 .离散 系统 与 连续 系统 的 最 优 轨 线 比较 如 图 3-3 


所 未 。 


应 用 离散 极 小 值 原理 和 连续 极 小 值 原理 求解 同一 最 优 控 制 问 题 ,只 要 采样 周期 选择 
适当 ,可 以 得 到 十 分 相近 其 至 是 相同 的 结果 。 现 以 变 分 学 中 的 拉 格 朗 日 问题 ,对 这 两 种 方 


法 进行 分 析 和 比较 。 
设 要 求解 的 连续 极 值 问 题 的 数学 模型 为 
min/=| "L(x,n dt， tf 固定 


S.t, X=f(xut), X(to)=ro 
。84。 


(a) 壕 续 系 统 (b) 山 散 系 统 


图 3-3 最 优 轨 线 


对 上 述 时 变 系统 、 积 分 型 性 能 指标 .上 固定 和 末端 月 由 的 最 优 控制 问题 ,有 两 种 求解 办 法 。 
一 是 直接 用 连续 极 小 值 原理 ,得 到 连续 的 正则 方程 ,然后 将 正则 方程 离散 化 ,求解 离散 的 
两 点 边 值 问题 ; 男 一 种 办 法 是 将 连续 系统 方程 离散 化 ,用 离散 极 小 值 原理 得 到 离散 两 点 边 
值 问 题 。 现 分 述 如 下 。 


(1) 连 续 极 小 值 原 理 方法 
由 表 3-2, 最 优 解 的 必要 条 件 为 : 
哈密 顿 男 数 
HlxyusAst)= Lx ut) tA GF x,u,t) (3-118) 
正则 方程 
#0)— SL = fut) (3-119) 
8 9LGCu,t) 9f (x,u,t) 
A 人) 一 Ey A (#) (3-120) 
边界 条 件 为 
X(to) = xo (3-121) 
A (11)=0 (3-122) 
极 值 条 件 为 
2 Lt) | 2S Cernet) KH) CD) 一 0 (3-123) 


ou au 
于 是 , 式 (3-119) 一 式 (3-123) 构 成 连续 时 间 的 两 点 边 值 问题 。 如 果 用 计算 机 求解 , 取 一 阶 
差分 来 近似 一 阶 微分 运算 ,并 令 了 为 采样 周期 ,可 得 
一 区 十 二 一 区) -+ DLA] 


X(t) | ,好 一 (3-124) 
A | 二 ~ 44+ ~ A CE) att ra (3-125) 
ACID LO 售 得 正 出 广 班 记 家 人 
X(R 十 1) 一 x(R) 十 人 FLIx(R) ,uk) ,Ek| (3-126) 
加 加 ALLxCk) ECR) Ek af [x(k),uck),k| 
A(k+1)=A(k) Tr Ti A(k) (3-127) 
边界 条 件 及 极 值 条 件 相应 为 
xX(0)=xo (3-]128) 
A(N)=0 (3-129) 


* BO. 


aLIx(k),u(lk) | 19Ff Lx Ck) suk) ,Re) 


aoautlk) Qu (Ck) A(k)=0 (3-130) 
于 是 , 式 (3-126) 一 式 (3-130) 构 成 等 价 的 离散 两 点 边 值 问题 。 
(2) 离 散 极 小 值 原理 方法 


这 时 ,状态 方程 及 其 初始 条 件 的 一 阶 差 分 近似 为 
x(k+1)=x Ck) TFLx CR), uk),k | 
xX(0)=xo 

性 能 指标 的 离散 化 表示 式 为 
J=T OL[LxCk) ,uCk),k] 


上 一 


因此 ,离散 哈密 顿 函 数 为 
HOR)=TL[xCR) uk) RE 十 AT (kT1) {xCE) TfLxCE) ,ulk) ,k]) 

相应 的 协 态 方程 和 横 截 条 件 为 

DA EA 


,Of TTx Ck) ,uk) ,k] 
A Ck) = = i [I+T 人 (十 1 
1 (N) 一 0 
极 值 条件 为 
HOR) .3aLFz(CE) uk k] 37rTx(E) ,uk),k] 和 
uty 一 guck) Ti mck) A (kT1)=0 
于 是 ,离散 两 点 边 值 问题 可 归纳 如 下 : 
x (RE 十 1) 一 Y(E) 十 六 PICRE) ,uk) ,k] (3-131) 
.9f [xR uCE) 11 ,9 LLx Ck) ,nu(k),&] 
ACT) 一 1 十 了 | ACh) Te (3-132) 
x(0)=x, (3-133) 
ACN)=0 (3-134) 
9AL[xCkR) ue) Rk]| 9F [xCk), uk),k| 加 
Qu lk) 十 395(R) “人 二 1 一 人 和 
(3) 两 种 方法 的 比较 


比较 上 述 两 种 离散 两 点 边 值 问 题 可 以 发 现 ,状态 方程 (3-126) 和 (3-131)、 初 始 条 
件 (3-128) 和 (3-133)、 横 截 条 件 (3-129) 和 (3-134) 都 是 相同 的 ,而 协 态 方程 (3-127) 和 (3- 
132) 及 极 值 条 件 (3-130) 和 (3-135) 虽 有 类 似 之 处 ,但 毕竟 是 不 一 样 的 。 

当 采 样 周期 足够 小 时 ,A (&) 在 步 与 步 之 间 变 化 其 微 ,因而 4 (%) 与 41(% 十 1) 接 近 , 于 是 
式 (3-130) 和 式 (3-135) 表 示 的 极 值 条 件 基 本 相同 。 

如 采 将 式 (3-132)? 中 的 逆 和 矩阵 展 成 泰勒 级 数 ,近似 取 前 两 项 , 则 式 (3-132) 可 以 写 为 


of [xC(k),u(k),k) 。 加 aL|lx(k) ,u(tk),k] 
4 (+D= {1 T | 1 人 | 
将 上 式 乘 开 , 当 采样 周期 工 很 小 时 , 略 去 乘积 中 的 T? 项 ,得 
m9L[xCk) uk) ,| ,9 [x(k), uk),k] 
A (k++1)=A(E) Tx Tx A (k) 
1 9f [x(k) ,uk) ,bk 9LLx(k) ,uC(k),k] 
17 { x Ch) je I gxCk) 


上 式 与 式 (3-127) 完 全 相同 。 
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从 以 上 分 析 可 知 ,由 离散 极 小 值 原理 方法 得 到 一 非 线 性 差分 方程 描述 的 两 点 边 值 问 
题 ,其 解 是 使 所 述 离散 问题 最 优 的 准确 答案 ;由 连续 极 小 值 原理 方法 得 到 一 非 线 性 微分 方 
程 描述 的 两 点 边 值 问 题 , 其 解 是 使 所 述 连续 问题 最 优 的 准确 管 案 ; 由 连续 两 点 边 值 问 题 离 
敬 化 后 所 求 出 的 控制 和 轨 线 , 既 不 能 使 连续 问题 严格 最 优 ,也 不 能 使 连续 问题 的 离散 模型 
广 格 最 优 。 然 而 ,只 要 采样 周期 足够 小 ,两 类 离散 两 点 边 值 问 题 的 计算 机 解 本 质 上 是 一 
样 的 。 

连续 极 小 值 原理 与 离散 极 小 值 原理 的 比较 如 表 3-3 所 示 。 


表 3-3 连续 与 离散 极 小 值 原 理 比较 表 


项 目 连续 极 小 值 原理 离散 极 小 值 原 理 


系 统 | x¥(2)= 二 fx() ,nt(t) ,+ x(k+1)= fix(k) uk) kh), k=0,l1,:…,N—1 


， N -1 
性 能 指标 7 一 红 xGt7) + | /Lr edt J 一 9LYCN)，N] 十 之 ) 世 [Lx(ED) ,ulk),k] 
0 =0 
极 值 问题 求 5 《站 使 J In 求 ww* (5), 使 = 二 min， 大 一 性 一 ] 
9 


HOE)=LLx CR) wR) EJ] HATRETI) FT xR) ,wk) ,下 
k=0,1,.… 人 一] 


#8+1)— ,ACR) = Hk) 


9A (十 1)， 


orxck) 


) (2) = Ht a XCN),N] 


dxttr) Bf 
9Lxzttr):tr 一 0 时 Cr) 一 0 中 xzCRA),N] = 一 0 时 ,人 ACN) 一 0 


全 2 过 一 BLD k=—=0,1,.…,N—1 
(控制 无 约束 外 98 auk) 


极 小 值 条 件 Hlx* (Ck) ,uu* (RR),A CR+1), 
‘控制 有 约束 ) = min HLlx" (&),w(k),ACkt1),»] 


bt) 


横 截 条 件 
( 末 病 自由 ) 


AN ) 一 


H(x’* 5 | 0) = minHlx" 到， 从 ?了 
上 


3.3 时 间 最 优 控制 


上 时间 最 优 控制 问题 ,是 可 以 运用 极 小 值 原理 求解 的 一 个 常见 的 工程 实际 问题 ,如 果 性 
能 指标 是 系统 由 初 态 状 态 转移 到 目标 集 的 运动 时 间 , 则 使 转移 时 间 为 最 短 的 控制 称 为 时 


间 最 优 控制 ,或 称 最 速 控 制 。 本 节 将 主要 介绍 线性 定常 系统 的 时 间 最 优 控制 分 析 法 及 其 
应 用 。 


s 六 7 +. 


3.3.1 .一 类 非 线 性 系统 的 时 间 最 优 控制 


为 了 限定 讨论 问题 的 范围 , 现 将 问题 的 提 法 叙述 如 下 。 
问题 3-1 移动 目标 集 的 一 类 非 线 性 系统 的 时 间 最 优 控制 问题 为 


£ 
. 了 . 
InNnin 7==| dt=ty~to， 71 一 12， ,1m 
天 1 上 


S。fT， (1) (1)= flx(t) ,t+ BlxG), luli), X(to) 一 Yo 
(2) y [x Cty) ,tf |= 人 0 


式 中 x(DE Rult)ER”";f(，) 和 BC(…) 维 数 适当 ,其 各 元 对 x() 和 1 连续 可 微 ; 移 动 目 
标 集 y 《 。)ER' ,其 各 元 对 X(ty) 和 ti 连续 可 微 ;ty 是 状态 轨 线 首次 与 移动 目标 集 相 遇 的 


末端 时 刻 。 


显然 ,问题 3-1 属于 时 变 系 统 ,积分 型 性 能 指标 .ty 自由 和 末端 受 约束 的 最 优 控 制 问 


题 。 根 据 极 小 值 原 理 , 令 哈密 顿 函 数 
(xb 一 1 十 AGO(FLxGt) ,BLxC) ,lulz)) 


正则 方程 为 
aH 
X20) = T= fx(t) ,t+ BLx() ,ult) 
__939H_ 3939f,,、 9{B[LxG) ,u(t)}" 
A()= 本 7 一 Fx 4 (2) axd) 4 (£) 
边界 条 件 及 横 截 条 件 为 
x(to) 一 
yp Lx) ,t=0 
_ aoy 
A (DFGDY 
极 小 值 条 件 为 
1+A (ALx C0) ,t+ATG) BLx’ () ,tu (1) 
= min 人 1 十 4 CG)fLx’ (2) ,7 +A (BLx’ (2) ,jul)) 
或 
A (BELx* (4),t lu’ (一 min A CBELx’ CG) ,Jud) 
因而 得 


& (1 一 一 sgnLB (x* ,1)A (4)] 
式 中 sgn(。) 为 符号 函数 。 若 令 


B(x,t)=| b,x) 5 (YL) sb (Xt) |, b,x,t) ER", j=1,2,. 


gi(t) =bT x, 0), j=1,2," ,Mm 

则 最 优 控 制 分 量 应 取 
wu; sens, gi(1)<0 
一 1， g,;(t)>0 

企 最 优 轨 线 末 端 ,哈密 顿 函 数 应 满足 


s Rs 


(3-136) 


(3-137) 
(3-138) 
(3-139) 


(3-140) 


(3-141) 


(3-142) 


(3-143) 


sn 


(3-144) 


H' 47)=—Y' (3-145) 


由 式 (3-137) 一 起 (3-141) 以 及 式 (3-144)、 式 (3-145) 构 成 的 最 优 解 的 必要 条 件 知 , 春 
gj(t) 关 0, 则 可 以 运用 极 小 值 原理 确定 w; (2) ,此 时 称 为 正常 (或 平凡 ) 情 况 ; 若 gj(2) 二 0， 
u; 不 定 ,可取 满 足 约 束 条 件 |&j; 愉 ) | 志 1 的 任意 值 ,此 时 称 为 奇异 (或 非 平 凡 ) 情 况 。 下 面 给 

定义 3-1 设 在 区 间 [wo,tyj] 内 ,存在 时 间 可 数 集合 

toy—= {tiyytas HELto ty], 1=1,2,,m 
使 有 
上 一 了 Ai 


OO ， 
(2) =b; (x* ,0M (1)= ， 
韭 零 ， i 六 ts， 


vy 7 三 1] ,2,*'* ,Mm 


则 时 间 最 优 控 制 是 正常 的 。 

正常 的 时 间 最 优 控制 问题 ,其 wj (4) 与 gj; 以) 的 关系 如 图 3-4 所 示 。 范 数 gj(2) 仅 在 有 
限 个 孤立 的 时 间 有 瞬间 取 等 值 ,相应 的 最 优 控 制 分 量 u; GO) 为 分 段 常 值 函数 , 且 在 函数 g， 
(1) 过 等 的 时 列 发 生 跳 变 。u; (1) 这 种 控制 规律 称 为 Bang-Bang( 邦 - 邦 ) 控 制 律 ,可 用 极 小 值 

定义 3-2 设 在 区 间 |to,tyij 内 ,至 少 存在 一 个 子 区 间 , [zi,tsjE [wo,tij, 使 得 对 所 有 : 
ELti,tsj ,至 省 有 一 个 销 数 

gi(t)=b; (x* ,tA G4)S=0 

则 时 间 最 优 控制 是 奇异 的 ,区 间 [z ,tj 称 为 奇异 区 间 、。 

奇异 的 时 间 最 优 控制 问题 ,其 zy (2) 与 gj;(4) 的 关系 如 图 3-5 所 示 。 孙 数 g;(1) 在 整个 
子 区 间 [ ,ts 上 取 零 值 ,这 时 ,由 ww (4) 二 一 sgn(g; 民 )) 无 法 确定 最 优 控 制 a* (7) ,但 是 , 奇 
异 情 况 并 不 表示 时 间 最 优 控制 不 存在 ,只 表明 用 极 小 值 原理 无 法 确定 最 优 解 , 需 要 采用 奇 
界 最 优 控 制 方法 求解 。 有 关 奇 异 最 优 控制 问题 ,将 在 第 8 章 讨 论 。 


一 > Le - 非 平 几 羽 合 


] 
1 

I 

| 

| 
4 

! 

) 

] 


\ u’=~— Sgnt9(0)} 


gD) uD) u(t) 


图 3-4 正常 时 间 最 优 控制 问题 图 3-5 奇异 时 间 最 优 控制 问题 
对 于 正常 时 间 最 优 控制 问题 ,可 以 归纳 为 如 下 定理 。 
定理 3-9 邦 - 邦 控制 原理 。 
这 2 ”是 问题 3-1 的 时 间 最 优 控制 ,x* (zt) 和 A (2) 是 相应 的 状态 向 量 和 协 态 向 量 . 若 
问题 是 正常 的 , 则 最 优 控 制 为 
u” (ft)=~—sgn(B' lx’ (1) ,tA GG)) 
* 390s 


定理 表明 ,每 个 控制 分 量 xy (4) 恰好 在 自己 的 两 个 边界 值 之 间 来 回 切换 ,满足 g;() 
==0 的 各 个 ty 点 正好 是 切换 点 。 这 是 一 种 继 电 型 控制 或 开关 型 控制 , 故 有 邦 - 邦 控制 之 称 。 
正常 问题 的 时 间 最 优 控制 框图 如 图 3-6 所 示 。 


po 


图 3-6 ”线性 定常 系统 的 时 间 最 优 控 制 


3.3.2 线性 定常 系统 的 时 间 最 优 控制 


设计 时 间 最 优 控制 系统 之 前 ,总 是 希望 知道 问题 是 否 有 解 ? 是 否 有 唯一 解 ? 问题 是 正 
常 的 还 是 奇异 的 ? 这 种 对 一 般 规 律 的 认识 和 了 解 有 助 于 具体 系统 的 设计 。 不 幸 的 是 ,对 于 
任意 的 非 线性 系统 和 任意 的 目标 集 , 目 前 还 没有 解答 这 些 问 题 的 一 般 结 论 。 但 是 ,对 于 常 
见 的 目标 集 为 状态 空间 坐标 原点 的 线性 定常 系统 的 时 间 最 优 控制 问题 ,可 以 回答 上 述 问 
题 。 因 为 目标 集 是 状态 空间 的 原点 ,所 以 下 述 问题 常 称 为 时 间 最 优 调节 器 问题 。 

问题 3-2 ” 设 线 性 定常 系统 

X(t)— Ax(t) Bult) (3-146) 

是 完全 可 控 的 。 其 中 ,x(2) ER ,u(t)E R”,A4、B 和 窍 阵 维 数 适当 。 求 满足 下 列 不 等 式 约束 的 
容许 控制 向 量 wu (2): 


[0) 1， j=1,2,.…,m (3-147) 
使 系统 (3-146) 从 已 知 状态 
x(0)=xo (3-148) 
转移 到 状态 空间 原点 
| x(t/)=0 : (3-149) 
并 使 性 能 指标 : 
7]=| di (3-150) 
最 短 。 


求解 问题 3-2 之 前 ,应 首先 判断 问题 3-2 是 否 正常 ? 若 问 题 正 常 , 则 可 用 极 小 值 原理 
求解 。 
定理 3-10 在 问题 3-2 中 , 令 


B= |[b. ,b,,*** ,b,, | (3-151) 
式 中 bER’ ,t=]1,2,° ,mo 当 且 仪 当 nL 个 矩阵 
G;=[b;,Ab;, A:b,,.…,A” 'b,], 7 一 ] ,2 ,1 (3-152 ) 


中 ,至 少 有 一 个 是 奇异 矩阵 时 ,问题 3-2 是 奇异 的 。 
证 朋 构造 哈密 顿 枉 数 
H(xsu,aA)=1+A GG) AxG) Bu) | (3-153) 
由 于 问题 3-2 是 定常 系统 、 积 分 型 性 能 指标 ,tj 自由 、 末 端 固定 和 五 不 显 含 1 的 最 优 控 制 
问题 , 故 由 极 小 值 原理 知 , 沿 最 优 轨 线 有 


es O00. 


H’*()=H’*(;)=0 (3-154) 
所 以 在 式 (3-153) 中 , 必 有 


(天 0，VIGLOt7 (3-155) 
否则 ,五 (一 1, 与 式 (3-154) 巴 盾 。 
由 协 态 方程 
9HFH _ 7 l 
人 (一 Ix A A() (3-156) 


式 (3-156) 为 线性 定常 齐 次 微分 方程 ,其 解 为 
A (2)=e-4 AC0) 
由 式 (3-155) 知 , 必 有 A (0) 关 0。 因 而 


gi(t)=b; 4G)=A (b=A (0)e “pb, (3-157) 
设 存在 奇异 区 间 |[ti,ts]€L0,tyj, 使 有 
g(t) 二 A (0)e “pp 二 0， Yt€E14,t;]， ;任意 (3-158) 
对 式 (3-158) 求 导 , 根 据 窍 阵 指 数 性 质 , 可 得 
(—1)” ‘gr” (1t)=A (0)e “A”" 'b;=0 (3-159) 
将 式 (3-159) 写 为 如 下 矩阵 形式 ， 
AT(O)[e “pb;,e “Ab,,.…,e “A" 'b,;|=0 (3-160) 


由 矩阵 论 知 , 辣 量 4 (0) 有 非 零 解 的 充 要 条 件 是 系数 矩阵 奇异 ,因此 式 (3-160) 成 立 的 
充 要 条 件 为 
det[e- “pb,,e “Ab;,,e™ “A"™b;]—dete “det[b;, Ab,,.…,A” 1b;]=0 (3-161) 
因为 转移 矩阵 e-“ 非 奇异 ,车 令 式 (3-152) 成 立 , 则 式 (3-161) 成 立 的 充 要 条 件 为 
detG;=det[b,, Ab;,: , A"-1b,]=0, 7 任意 
由 定理 3-10 不 难得 到 问题 3-2 正常 的 充 要 条 件 。 
定理 3-11 当 且 仅 当 
rankG;=ranklb;, Ab;,…,A” 'b;|l=n, VY j=1,2,.",m (3-162) 
式 中 b,€E R", 满 足 式 (3-151), 则 问题 3-2 是 正常 的 。 
定理 3-10 和 3-11 的 推 证 过 程 及 最 后 结果 均 未 涉及 目标 集 。 因 此 ,不 论 目 标 集 如 何 ， 
只 要 被 控 系 统 是 线性 定常 的 ,这 两 个 定理 均 可 应 用 ,通常 ,将 满足 定理 3-11 的 被 控 系 统称 
为 正常 系统 .显然 ,对 于 正常 系统 ,其 时 间 最 优 控制 问题 也 是 正常 的 , 且 可 用 极 小 值 原理 确 
定 其 时 间 最 优 控制 律 。 
正常 系统 与 可 控 系 统 之 间 存 在 包含 关系 。 在 nXn 矩阵 
Gj;=[b;, Ab, : A"'b,] 
中 ,增加 一 些 线性 无 关 列 , 则 其 行 秩 不 变 。 因 此 式 (3-162) 可 写 为 


rank[b; Ab; … A"-ib,| 
=—rank[lb: 4847 Ib :ob AbeoeAr lib, i bs Abn*A”'b, | 
= (3-163) 
考虑 到 式 (3-151), 式 (3-163) 可 写 为 
rank[B AB … A 'B|=n (3-164) 


。 Oj » 


式 (3-164) 正 好 是 系统 (3-146) 完 全 可 控 的 充分 必要 条 件 。 因 此 ,正常 子 空间 包含 于 可 控 子 
空间 。 或 者 说 ,正常 必 可 控 , 但 可 控 不 一 定 正常 。 这 种 包含 关系 表明 ,系统 可 控 是 系统 正常 
的 前 提 条 件 。 因 此 ,在 问题 3-2 中 提出 了 系统 完全 可 控 的 要 求 ,显然 ,对 于 单 输入 系统 ,Jj 一 
1 ,正常 子 空间 与 可 控 子 空间 相互 包含 ,系统 正常 与 系统 可 控 彼 此 等 价 。 

对 于 正常 问题 ,可 以 证 明 如 下 唯一 性 定理 成 立 。 

定理 3-12 在 问题 3-2 中 , 若 系统 (3-146) 是 正常 的 , 且 时 间 最 优 控制 存在 , 则 最 优 控 
制 必定 唯一 。 

证 明 设 wur (和 w2? () 是 两 个 以 相同 最 短 时 间 好 将 系统 (3-146) 由 已 知 初 态 xo 转 
移 到 状态 空间 原点 的 最 优 控 制 ,x? (和 xz (2) 是 分 别 相 应 于 wr (4) 和 wz (2) 的 最 优 轨 线 ， 
则 系统 (3-146) 的 解 为 


Xr (t)=e”|[ Yo + | eBui (Tt) dr | 
0 


TX (t) ~—e“*| xo + | eBu; (tT) dr | 
当 一 /7 时 ,有 有 


XI (tf )—=x> (tf )=0 


因为 所 为 非 奇 异 和 矩阵 , 故 有 
| eaui (dr=| eBu; (tT)dr (3-165) 
心 0 
由 协 态 方程 解 
NG =e NO0), (=e-4 NAc0) 
可 得 | 
ur (1)=—sgn[Bre 4 ‘A (0)] (3-166) 
u? (1)=—sgn[ Bre-* ‘A,C0)] (3-167) 


由 于 问题 是 正常 的 ,所 以 除 有 限 个 开关 点 外 , 式 (3-166) 和 式 (3-167) 分 别 唯一 地 确定 了 最 
优 控 制 wr GG) 和 wz (4)。 
在 认定 uf (2) 为 最 优 解 ,根据 问题 3-2 的 极 小 值 条 件 ,应 满足 
A 0)e “Bur (2)<A Oe Buz C(t) (3-168) 
式 (3-168) 表 明 , 当 wr? (的 天 村 (1) 时 , 式 (3-168) 为 严格 不 等 式 ; 只 有 当 wr G4) 二 wx (1) 时 , 才 
用 入 (0) 左 乘 式 (3-165) 两 端 ,可 得 


| A (0)e “Bu; (Ddr=|" Al (0)e “Bu’ (r)dr (3-169) 


为 使 式 (3-168) 和 式 (3-169) 同 时 成 立 , 必 有 
ur (2) =u (t), VY 1ELO,t}] 
在 定理 3-12 的 证 明 过 程 中 ,主要 用 了 两 个 方程 :一 是 由 极 小 值 条 件 导出 的 不 等 
却 (3-168); 另 一 是 由 最 优 轨 线 到 达 同 一 终点 导出 的 等 式 (3-169)。 前 者 与 终点 情况 无 关 ， 
后 者 也 不 要 求 终 点 必须 为 零 , 故 唯一 性 定理 同样 适用 于 一 般 目 标 集 的 情况 ，。 
下 面 研 究 当 系统 正常 .时 间 最 优 控制 为 邦 - 邦 控制 时 ,切换 次 数 的 规律 性 。 可 以 证 明 ， 


»。092。 


车 系统 矩阵 4 的 特征 值 均 为 实数 时 ,时 间 最 优 控制 的 切换 (人 开关) 次 数 人 存在 上 限 。 由 于 是 
理 证 明 的 需要 , 先 介 绍 如 下 定理 。 

定理 3-13 设 j(i==1,2,…,m) 为 互 异 实数 ;pi(2) G1,2,…,m) 分 别 为 次 数 等 于 
ki(i 二 1,2,… ,Mm) 的 实 系 数 多 项 式 ;NN 为 多 项 式 方程 


> pilt)e”=0 (3-170) 
:= 1 
的 实 根 个 数 。 则 必 有 / 
N< bt ml (3-171) 


证 明 ” 现 用 数学 归纳 法 证 明 该 定理 。 当 六 一 1 时 ， 定理 显然 成 立 。 因 为 图 数 pi(t)e”' 与 
函数 2 (1) 有 相同 实 根 。 

假定 对 于 m 一 1 项 的 多 项 式 方程 (3-170), 引 理 已 经 得 证 , 现 证 明 对 mx 项 的 情况 引 理 
也 是 正确 的 。 


反 设 m 项 时 引 理 不 成 立 , 则 方程 (3-170) 至 少 有 2) 十 m 个 实 根 。 用 e-“” 冬 以 
式 (3-170) ,可 得 


m— 1 
> per mt p(t)=0 (3-172) 
:=] 


上 述 方 程 仍然 有 之 1 大 十 7 个 实 根 。 因为 也 数 的 每 两 个 实 根 之 间 , 至 少 有 其 导数 的 一 个 根 ， 
故 式 (3-172) 的 ,十 1 阶 导 数 方 程 


Ye (De 一 0 (3-]73) 


的 实 根 至 少 有 
| 3 十 zz] — (kt1)= > + Gn—1) 


个 ,其 中 总 GD) 的 次 数 仍 等 于 天。 
考察 方程 (3-173), 该 方程 有 m 一 1 项 ,根据 归纳 法 假设 , 式 (3-173) 的 实 根 不 多 于 


SYh 14m 2 个 。 于 是 ,产生 矛盾 , 反 设 不 成 立 。 从 而 完成 了 对 定理 的 证 明 ， 


定理 3-14 有 限 切 换 ( 开 关 次 数 ) 定 理 。 

说 线性 定常 系统 (3-146) 是 正常 的 ,nXn 系统 矩阵 4 的 全 部 特征 值 均 为 实数 ,时 间 最 
优 控制 w* (4) 存 在 ,其 分 量 为 wi (1)。 令 zg; 表示 wu; (2) 的 切换 时 刻 , 则 wx (4) 在 两 个 边界 值 
之 间 的 切换 次 数 Nn 一 1。 其 中 是 系统 (3-146) 的 维 数 。 

证 明 已 知 时 间 最 优 控制 为 如 下 形式 : 

ui (1)—=—sgn{gj;(t)}, j=1,2,.…,m 
昂 数 
gi(t)=b; A ()=A' (Cb, 
切换 时 间 好 是 方程 
gj(t) =AX 0b 一 0 (3-174) 
z 站 O03 . 


的 实 根 。 由 于 系统 正 弟 , 故 
gi(t)0, VY 1€EL0,t) 


于 是 解析 函数 g;(2) 仅 在 有 限时 间 点 上 为 零 。 所 以 ,方程 (3-174) 的 实 根 个 数 束 是 ww? (2) 的 


切换 次 数 。 
已 得 
AT()=A 0)e “, 和 (0) 天 0 


式 中 4 有 ?个 实 特征 值 。 设 其 中 有 m 个 两 两 不 同 的 特征 值 AAA <2) ,其 重 数 


分 别 为 lib hm , 必 有 


则 协 态 向 量 4 (4) 的 各 分 量 可 表示 为 
A = Dh pa em, 1 一 ] ,2,"*,n 
式 中 p(t) 为 实 系数 多 项 式 , 其 次 数 为 ki 一 Li 一 1 。 若 令 
六 一 LO， bs 1 bn] 
则 解析 男 数 
有 (一 在 (太一 > (OO J 一 1，2，…，77 
将 式 (3-175) 代 入 式 (3-176) ,可 得 
gD) = Db DN pate 71 一 1 ,2，…，7t 
令 上 式 为 零 , 其 实 根 个 数 显然 是 下 列 多 项 式 方程 的 实 根 数 ， 
Sp em=0 
由 定理 3-13 知 方程 (3.177) 的 实 根 个 数 为 
N< > um-I=- DDtm1— D1=n—1 
根据 以 上 理论 分 析 ， 问题 3-2 的 求解 过 程 可 以 归纳 为 如 下 定理 。 


定理 3-15 对 于 问题 3-2, 若 系统 (3-146) 正 常 , 则 最 优 解 的 必要 条 件 为 ，; 


QD 正则 方程 
#0)— Ax(t) + Bule) 
__9H__ 
A (#)= 3 一 4 A(z) 
式 中 哈密 顿 函 数 
HlxA,u)=1A GF AxCG)+Bud) | 
@) 边界 条 件 


z XxX(0)—= xo, x(t:)=0 
(3) 极 小 值 条 件 


* 日 4 。 


(3-175) 


(3-176) 


(3-177) 


二 1， 当 b; A444)< 二 0 
一 1]， 当 bi 4()>0 
若 4 有 全 部 实 特 征 值 , 则 w;? (1) 的 切换 次 数 Nn 一 1。 

9 瑟 滑 数 变 化 律 


u’ (1)=—sgnlb; 4 (i) | 一 


HH’ (tf)=0 
例 3-8 设 人 造 卫星 姿态 控制 系统 方程 为 
Zi 一 Tt Xi(0)=1, Zr 一 0 
Zt)=u(t), X20)=1, ztr) 一 0 
控制 约束 
—1u(lt) 夺 1 
要 求 确定 x* (1) ,使 性 能 指标 
J=| /dt 
极 小 ,并 求 出 切换 时 间 1, 和 最 短 时 间 好 。 

解 ” 本 例 为 二 次 积分 模型 的 时 间 最 优 控制 问题 。 不 难 验 证 ,系统 是 完全 可 控 的 ,因而 
也 是 正常 的 ， 故 时 间 最 优 控制 必 为 邦 - 邦 控 制 。 由 题 意 可 得 4 的 特征 值 为 内 一 pe 一 0,， 故 
uu? (的 切换 次 数 六 委 1。 

构造 哈密 顿 函数 

到 一 1 十 让 十 At 
由 定理 3-15 知 , 最 优 控制 
十 1， 当 (1)<<0 


“ {1)= 二 一 ht = 
sgnhDIT| wo 


由 协 态 方程 
aH 
9 如 
A, (1) 一 I A (1) 
解 得 
A (1) 一 C 


Ai) 一 一 Ciz 十 cs 
因为 协 态 向 量 4〈 刀 为 非 零 向 量 , 故 ci 与 c; 不 能 同时 为 零 。 根 据 c 与 c: 的 不 同 组 合 ,1 (6 
的 可 能 形状 如 图 3-7 所 示 。 因 而 候选 控制 序列 为 ; {十 1}, {一 1},{ 一 1, 十 1},{ 十 1, 一 1}。 
为 了 进一步 阐明 系统 的 运动 规律 ,可 以 采用 相 平 面 进行 分 析 。 令 wu* (4)= 二 1, 由 状态 方 
程 可 得 
Z(t)—=u=1, Xi) 一 十 Zr(C0) 
ZL1(f) = z(t) tr 0) 


zc (1) = 十 za(0)t 十 Zz1(0) 
在 上 述 方 程 中 消去 1, 得 相 轨 迹 方 程 


s。 95 。 


图 3-7 (4) 的 可 能 形状 


zi 一 却 开 十 [zi(0) 一 斑 友 (0)] 
上 式 表 示 一 艇 抛物 线 。 显 然 ,满足 末 态 要 求 的 相 轨 迹 为 
) 一 {(zhza)|z 一 于 zza<0) (3-178) 
若 令 x (三 一 1, 则 相 轨 迹 方 程 为 
六 一 一 友好 十 [= (0) 十 误 2C0) | 


2 
上 式 也 描绘 了 一 簇 抛物 线 , 而 满足 末 态 要 求 的 相 轨 迹 为 
7_ =—{(zivze) z= 一 志 z, zs 之 0) (3-179) 


2 (t) 二 1 和 2z” (1) 二 一 1 的 系统 相 轨 迹 如 图 3-8 所 示 。 由 图 可 见 , 如 果 初 态 (zx1(0) ,zs(0)) 
位 于 7Y+: 上 , 则 最 优 控 制 律 w* (4) 二 十 1。 这 时 ,系统 自 初 态 沿 着 7; 运 动 到 坐标 原点 。 同 理 ， 
车 (zx1(0),x2C0)) 位 于 7Y_ 上 , 则 ww* (4)== 一 1, 系 统 沿 7_ 运 动 到 坐标 原点 。 

曲线 ”和 ;组 合成 曲线 ,其 表达 式 为 


7 =7Y. U7 ={Crsze) z=—572 zl) (3-180) 


曲线 7 将 相 平 面 分 割 为 R+ 和民 -两 个 区 域 ,如 图 3-9 所 示 。R+ 和 R_ 作 为 状态 集合 ,可 表 
示 如 下 : 


Ri= {riz2) |z1<—5z2lz|} (3-181) 
R ={(z1,z0) |r>—5zlzl) (3-182) 


当初 始 状态 (zi (0) ,zz(0)) 位 于 区 域 尺 .时 ,例如 ,图 3-9 中 的 点 4, 最 优 控制 x* = 一 1， 
当 相 轨迹 到 达 ”上 的 C 点 时 ,实现 zx (从 一 1 到 十 1 的 切换 ,然后 沿 ,运动 到 原点 O， 
因而 最 优 控 制 律 w* (= (一 1, 十 1) ,最 优 轨 线 为 4BCO。 当 初始 状态 (z, (0) ,zs(0)) 位 于 
区 域 R+ 时 ,例如 ,图 3-9 中 的 DD 点 ,最 优 控制 先 取 w* (1)= 十 1, 当 相 轨 迹 到 达 7Y_ 上 的 E 
尽 时 ,实现 wx* (从 十 1 到 一 1 的 切换 ,然后 沿 7-_ 运 动 到 原点 O, 因 而 最 优 控 制 律 x* (2) 二 
(十 1, 一 17 ,最 优 轨 线 为 DEO。 由 于 wu* (4) 的 切换 均 发 生 在 曲线 XY 上, 线 7 称 为 切换 曲线 ， 


* O006. 


或 开关 曲线 。 


0 一 十] 


图 3-8” 相 轨迹 图 图 3-9 相 平 夯 上 的 开关 曲线 
对 于 一 般 的 二 次 积分 模型 的 时 间 最 优 控制 问题 ,其 最 优 控 制 律 为 
十 1， vy (X19T2) EY UR, 
机 oo Vv (X15T. ET UR 
本 例 (z1(0),zx2(0)) 二 (1,1)ER- , 故 最 优 控 制 律 u* (2) 二 {一 1, 十 1}。 为 了 具体 求 出 
切换 时 间 1,, 需 要 求解 最 优 轨 线 方程 。 
由 ABC 段 :wu* (40) 二 一 1 ,zx1(0) 二 zx,(0)==] 
上 


Ta) 一 一 1 十 1 


(3-183) 


到 这 C 点 时 ,t= 二 i,, 则 有 
Xi1(t,) = 一 工种 十] 
< (3-184) 


Tai) 一 一 上 十 ] 
由 CoO 段 :xz 人 一 十 1 


(2) 一 方 台 十 at 十 ai 


at) 一 上 十 aa 
代入 zi) 一 ztr) 一 0, 解 出 


故 有 
] ] 
(1) 一 Dt ttst st 
X(t) 一 上 一 上 7 


在 C 点 处 ,上 式 可 写 为 


] ， ] ， 
1 ) 一 一 才 一 上 8 十 一 
1" 一 /27 (3-185) 
TX,(t,)—=t,—ty 


比较 式 (3-184) 和 (3-185), 得 
—t, 十 1] 二 t, 一 ty 


了 1 1, 
2 ts tt 1= 2 ts Zr 十 ti 


因而 求 出 
1 一 2.22， tf 二 3.44 


于 是 ,本 例 的 最 优 控制 律 
一 一 1， 0 委 !<<2. 22 
十 1， 2. 22 委 上 委 3. 44 
应 当 指 出 ,在 本 例 求解 w" (zt) 过 程 中 ,只 采用 了 “最 优 控 制 必定 使 哈密 顿 注 数 极 小 ”这 
一 事实 ,以 及 h(z) 形 状 提供 的 信息 ,并 未 具体 求解 协 态 4(2) ,因而 不 再 需要 “ 沿 最 优 轨 线 


哈密 顿 清 数 为 零 ” 这 一 条 件 。 
3.3.3 时 间 最 优 控 制 的 应 用 


有 些 实际 问题 并 不 要 求 将 相 点 控制 到 状态 空间 的 原点 ,而 是 到 某 一 集合 ,我 们 仍 以 二 
次 积分 模型 为 例 , 讨 论 非 零 目 标 集 的 时 间 最 优 控制 问题 。 
问题 3-3 已 知 线 性 定常 系统 的 状态 方程 为 


ZE) 一 Tt) 
人 (3-186) 
式 中 控制 变量 (2) 满足 约束 条 件 
lua(2) Rl, ViELO,t) (3-187) 
要 求 最 优 控制 w" (7) ,使 系统 (3-186) 由 任意 初 态 
XI1(0)=Zx10, Xi(0)= x0 (3-188) 
以 最 短 时 间 转 移 到 目标 集 
gl riltr) ,ralti) |=zxi(ty)=0 (3-189) 


问题 3-3 与 问题 3-2 的 主要 差别 是 目标 集 不 同 。 对 于 固定 的 目标 和 集 而 言 ,目标 集 的 改 
变 只 影响 模 截 条 件 。 由 极 小 值 原理 的 结论 ,问题 3-3 最 优 解 的 必要 条 件 为 . 
中 正则 方程 | 
全 (一 Tt) 


z,(t)=u(lt) 
A (一 -52=0 
, (3-190) 
N= ht) 
式 中 
H=1++A (tr (tt) 二 A (tu CE) 
包 边界 条 件 


。 O88。 


9 
At 一 5 辣 / 一 


ZiCO) 一 0， 
(3-191) 
(0) = zo. 9 
人 A, (ty) Fx) 0 
pLzrilts) ,zxalty) 一 Zr 一 0 
G) 极 小 值 条 件 
1 十 和 达 十 hass1 二 Na 十 Na (3-192) 
9 沿 最 优 轨 线 
H' (47)=0 (3-193) 


根据 极 小 值 条 件 知 , 最 优 控 制 律 
u”" (1)=—sgn{A, lt)) 
为 求 (2) ,可 由 协 态 方程 和 横 截 条 件 解 出 
A(t)=7, A,(t)=7Y (tt) 

由 于 0 亿 t 志 ty, 所 以 在 控制 过 程 中 h(t) 不 会 变 号 。 根 据 乘 子 7 的 符号 ,最 优 控制 w* (2) 只 
能 是 {十 1}) 或 者 {一 1;。 为 了 进一步 判断 最 优 控 制 律 , 需 要 考查 相 平 面 图 3-10。 

当 zw 之 0 时, 初 态 (zioyzzo) 位 于 右 半 相 平 
面 。 册 图 3-10 可 知 , 奉 初始 相 点 位 于 切换 线 Y+ 
之 上 ,如 4 点 , 则 只 有 xx 一 一 1 才能 将 相 点 转 
移 到 zt 三 0; 右 初始 相 点 位 于 切换 线 7 之 
下 ,如 已 点 , 则 二 = 一 1 和 三 一 十 1 均 可 将 相 
点 转移 到 rs 轴 ,但 最 优 轨 线 对 应 的 x 才 是 最 优 
控制 。 考 查 沿 最 优 轨 线 妃 函数 变化 律 

H* (=1+Azr? hu’ =0 
因为 4.)) 一 0,xz;(ty) 过 0, 必 有 
1— XA) [zs (7) |=0 


图 3-10 ” 相 平 面 图 
故 应 取 
A (tr 一 /0 
因 而 
As (1)=7(—t)>0, YiELO0,t) 
于 是 应 取 


ww (1)=—sgnt{4,0)}= 
同 理 可 知 , 当 zio<0 时, 必 有 ww (4) 二 十 1。 于 是 ,对 于 日 村 全 Xi1(t/) 二 0 的 二 次 积分 
模型 ,最 优 控 制 律 为 
十 1， 当 Xi1(1) 过 0 
2 (#) = 
一 1， 当 x1(1) 守 0 
最 优 轨 线 的 形状 如 图 3-11 所 示 。 显然 ,在 问题 3-3 中 , 极 小 值 原理 仍 给 出 最 优 控 制 的 
唯一 解 。 此 外 ,由 图 3-11 可 以 看 出 ,zz 轴 是 目标 集 , 向 量 [h(2) 加 (1) 一 [7 0J' 与 zz 
铀 垂直 ,这 表明 在 某 些 情况 下 , 横 截 条 件 表示 协 态 向 量 在 最 优 轨 线 的 末端 与 目标 集 正 交 。 
为 了 推导 问题 3-3 中 最 短 时 间 纪 的 一 般 表 达 式 ,需要 求解 状态 方程 . 当 zio>0 时 , 取 


ea 人 9 。 


i 一 一 1 ,状态 方程 的 解 为 
zi (一 一 方 如 十 ao 十 
Ta) 一 一 上 十 xzo 
其 相 轨 迹 方 程 为 
CD 一 一 去 地 CD 十 | ro 十 去 zi| 
由 于 t= 地 时 ,za 好) 一 0, 故 可 得 
tf 一 X20 二 Vv 2210 十 .50 ， Xi0>0 
(3-194) 
当 Zio<< 0 时 , 取 ww 二 十 1 ,对 应 的 相 胃 
图 3-11 问题 3-3 的 最 优 轨 线 迹 方程 为 


ZX1(1) = 去 地 CO 十 | ro 一 玛 z| 


同 理 得 
tf 二 一 Xo 十 VV 一 2Xio 十 X20， Zio< 0 (3-195) 
如 果 固 定 目 标 集 取 为 z(ty)= 二 0, 则 讨论 过 程 与 问题 3-3 类 似 。 
问题 3-4 已 知 系统 (3-186) 和 规定 的 目标 集 
pL xtr) ,rolts) |= rty)=0 (3-196) 
求 满足 约束 条 件 (3-187) 的 容许 控制 ,使 系统 (3-186) 以 最 短 的 时 间 由 任意 初 态 (3-188) 转 
移 到 目标 集 (3-196)。 
问题 3-4 的 求解 过 程 与 问题 3-3 几乎 完全 一 样 , 除 目 标 集 不 同 外 , 仅 模 截 条 件 应 改 为 
Ai(t7)—=0, A(ty)=7 
其 余 的 必要 条 件 均 不 变 。 
由 协 态 方程 及 横 截 条 件 知 ji 
A(t)=0, VitELO0,t] 
进而 可 知 h(z) 为 一 非 零 常数 。 因 此 ,最 优 控 


制 律 / 口 标 集 Y 
zt ”(t) 一 一 SgntAnz(t))} 


只 能 取 为 十 1 或 一 1, 中 间 不 会 发 生 切换 。 到 >- 
达 目标 集 zi 轴 的 最 优 轨 线 如 图 3-12 所 示 。 \ 
唯一 的 最 优 控制 律 可 写 为 


十 1， 当 zz( 世 <0 
uw’ (1t)—=—sgn{zx(t)}= 


一 ]， 当 xz,(t) 守 0 / nu*=+] 
关于 问题 3-4 中 最 短 时 间 刀 的 一 般 表 图 3-12 ”到达 目 标 集 的 最 优 扫 线 
达 式 ,读者 可 以 目 行 推导 。 
再 考虑 一 种 目标 集 为 闭 集 的 二 次 积分 模型 的 时 间 最 优 控 制 。 作 为 例子 可 研究 如 下 
问题 。 


问题 3-5 已 知 系 统 (3-186) 和 规定 的 旧 标 集 


”100。 


plxlt) |=zr,(ty)=0 (3-197) 
pal Xt) =ri(t) ee0 (3-198) 
求 满 足 约束 条 件 (3-187) 的 容许 控制 ,使 系统 (3-186) 以 最 短 的 时 间 由 任意 初 态 (3-188) 转 
移 到 目标 集 (3-197) 和 (3-198) 。 
在 此 问题 中 ,目标 集 (3-197) 和 (3-198) 可 统一 表示 为 
一 (zzz)|lz 一 0, 一 ai 魏 aa>0) (3-199) 
奉令 a 二 0, 则 目标 集 5 变 为 状态 空间 的 原点 ,根据 例 3-8 知 , 开 关 曲 线 y+ 和 7_ 的 方程 分 
别 为 式 (3-178) 和 式 (3-179)。 现 在 ,>0, 因 此 开关 曲线 方程 为 


) 一 {Cziyza) 人 zi 一 % 一 末 旭 ze<S0) (3-200 ) 


7 = {Cx 7) jz 十 0 一 一 方 车 ,之 0) | (3-201) 


于 是 ,开关 线 Y; .7 与 闭 目标 集 S 将 相 平 面 划分 为 C+ .G_ .Q; 和 Q_ 各 个 区 域 ,如 图 3-13 
所 示 。 定 义 


| 1 
C 一 人 + UG -一 (zi » TX) ] op*2 | 六， | 一 cmm< 委 一 村 zs | 之 ， | 十 a) (3-202) 


2 
和 
好 、 
， ~ © 
Hi 一 一 | 忆 
《7- 、、 (X1,x2) 
2 一 十 | 
\ 
、 
\ 
\ 
y O | 
\ 
\、 G+ 
入 
\ 
Q.: “、 
™ 
“上 1 一 十 | 


图 3-13 ” 相 平 面 上 的 区 域 


式 中 
C+ 一 (人 (zzz)| (zz)EGz<C0) (3-203) 
GO- ={(ri,T) | (x ,XT2) EG,T,>0)} 《3-204 ) 
则 在 G 域内 ,最 优 控制 取 
u(t)=—sgn{z(t)}, VY (r,t)EG 
再 定义 
Q+ 一 (Coza)|z>> 一 方 ilza| 十 oj (3-205 ) 
Q -一 (Cryza)|zm<< 一 广 zalza| 一 q) (3-206) 


则 问题 3-5 的 最 优 控制 律 为 


* 10] *。 


十 ]， YIGCzzECUQ UY, 
" oO=-| V (zz) EG UQ UY 
时 间 最 优 控制 问题 也 可 应 用 于 一 般 的 一 阶 系统 。 若 二 阶 系统 的 特征 值 为 实数 ,其 时 间 
最 优 控制 的 分 析 方 法 与 二 次 积分 模型 类 似 ; 若 特征 值 为 复数 或 纯 虚 数 , 则 分 析 方 法 较 二 次 
积分 模型 复 林 。 下 面 以 无 阻尼 振荡 二 阶 系 统 为 例 , 研 究 其 时 间 最 优 控 制 问 题 。 
问题 3-6 已 知 无 阻尼 振荡 二 阶 系统 的 状态 方程 为 


人 
(3-207) 
z(t) = — rt) u(t) 
式 中 控制 变量 wu(z) 满 足 约束 条 件 
[u(t) |<1, VE[O,t) (3-208) 
要 求 最 优 控 制 u* (1) ,使 系统 (3-207) 由 任意 初 态 
XT1(0)=z0, Zz.(0)= x, (3-209) 
以 最 短 时 间 转 移 到 状态 空间 原点 。 
由 极 小 值 原理 ,问题 3-6 最 优 解 的 必要 条 件 为 ， 
QD 正则 方程 
(DD) =z) 
z(t) = = z(tul) 
iD 一 一 5 二 一 如 人) 
(3-210) 
入 (DD) 一 一 5 一 一 (2 
式 中 
fH 二 1 十 zs 十 A,( 一 Xz 十 ww). (3-211) 
边界 条 件 
XI1(0)=7z0, ZX,(0) = ro 
Xi(ty)=0, ztr) 一 0 
@) 极 小 值 条 件 
u(t)=—sgn {ht)) (3-212) 
4 沿 最 优 轨 线 
li+A (tr (+R) — zr Gu (1) =0 (3-213) 
由 于 协 态 方程 与 x() 和 和 ww(z) 无 关 , 若 令 其 初 态 
A1(0)=ANo, (0) 一 1 
则 向 量 形式 协 态 方程 
|= 0 171Fai() 
i, () =- ,eo 
的 解 可 写 为 
A (z#) cost sint frA,, 
oo od) (3-214) 


"102。 


于 是 , 协 态 分 量 


A,(1)=— Aiosintt Azocost—=D cos (十 ao) (3-215) 
式 中 
D= ~ Mo 十 Az0 
Aio 
Qo arctan 1 
因此 ,最 优 控制 律 可 表示 为 
u’ (1)=—sgn{Deos(ttao)} (3-216) 
h(t) 与 xz” (1) 随 时 间 变 化 的 图 形 如 图 3-14 所 示 。 由 图 可 见 , 无 阻尼 振荡 二 阶 系统 的 最 优 


控制 具有 如 下 特 操 : 
QD 只 在 某 些 孤立 时 刻 为 堆 ,不 存在 奇异 段 , 放 最 优 控制 必 为 邦 - 邦 控制 。 
ol 最 优 控制 的 切换 次 数 与 系统 阶 数 无 关 。 
(3) 除 首 、. 尾 两 段 外 ,最 优 控制 每 隔 x 时 间 切 换 一 次 。 


图 3-14 无 阻尼 振荡 二 阶 系 统 的 4201) 与 u* (1) 曲 线 


为 了 进 一 步 研究 最 优 控制 律 并 推导 切换 线 方程 ， 将 zx (4) 及 X,() 曲 线 平移 % 距离 。 
令 w' (划一 十 1, 由 状态 方程 (3-207) 可 解 得 相 轨迹 方程 为 
(zi 一 1)2 十 z 一 民 (3-217) 
式 中 
R= vy (zo— 1) 二 x 
当 zio 和 xzo 为 不 同 值 时 ,Ri 为 不 同 常 数 ,所 以 式 (3-217) 描 述 了 以 (十 1,0) 为 圆心 ,以 尺 为 
半径 的 同心 圆 簇 , 且 相 轨迹 是 顺 时 针 方 向 运动 的 。 当 取 x“ (的 = 一 1 时 , 相 轨 迹 方程 为 
(ZI 十 ]) 十 z= 二 RR (3-2]18) 
式 中 
Rs= V (ziot1): 二 x 
式 (3-218) 摘 述 了 以 (一 1,0) 为 圆心 ,以 R, 为 半径 的 一 簇 同 心 贺 , 相 轨 迹 的 运动 方向 也 是 
顺 时 和 针 方 向 。 这 两 族 同心 圆 如 图 3-15 所 示 ，。 
由 图 3-15 可 见 , 在 众多 的 相 轨 迹 曲 线 中 ,只 有 R= 二 1 和 Rs 二 1 两 条 相 轨 迹 可 以 到 达 
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坐标 原点 ,满足 x1(ty) 二 x2(#y) 二 0 的 末 态 要 求 。 如 要 再 考虑 到 最 优 控 制 最 后 一 段 的 时 间 
间隔 委 r, 则 最 优 轨 线 最 后 一 段 必 位 于 下 列 两 条 半圆 形 开 关 线 ， 
7 ={(rr) | zi 一 1 十 Z5 一 1 zz<< 0 (3-219 ) 
7 一 (ziyzo)i (r+1) 二 xz;=1,xs>0) (3-220) 
之 上 ,两 半圆 相 切 于 原点 O, 如 图 3-16 所 示 。 当 相 点 运动 到 名 或 YY 上 的 任 一 点 时 , 均 可 在 
相应 的 控制 律 x 一 十 1 或 zx= 一 一 1 作用 下 , 洽 六 或 六 最 快 地 到 达 原 点 。 


图 3-15 w= 二 土 ] 时 的 相 轨 迹 图 3-16 开关 线 办 与 六 


现在 考查 最 优 轨 线 的 倒数 第 二 段 。 设 w* (4) 的 最 后 一 次 切换 发 生 在 7 上 的 A 点 ,如 
图 3-17 所 示 , 则 倒数 第 二 段 的 控制 必 有 x 二 一 1, 倒 数 第 二 段 的 最 优 轨 线 必 为 以 (一 1,0) 为 
加 心 的 圆 强 。 考虑 到 这 倒数 第 二 段 在 时 间 持 续 上 不 能 大 于 r, 故 该 圆 弧 的 长 度 最 多 等 于 半 
网 ,到达 图 3-17 中 的 4' 点 时 就 会 发 生 倒 数 第 二 段 转换 而 进入 倒数 第 三 段 ,由 于 A 点 可 以 
是 半圆 切换 线 X74 上 的 任 一 点 ,所 以 4 点 形成 以 (一 3,0) 为 圆心 .1 为 半径 的 半圆 ,定名 为 
7Y- ,其 集合 表达 式 为 


图 3-17 最 优 轨 线 
Yi ={(ri) ra) | (rt3) :+r:=]1, zr,>0) (3-221) 
显然 ,+ 是 x 一 一 1 到 zx 一 十 1 的 开关 曲线, 击 7Xi 是 uw= 十 1 到 一 一 1 的 开关 曲线 。 同 理 , 对 
应 于 w= 二 十 1 到 xv 王 一 1 的 开关 曲线 7% ,可 得 w= 二 一 1 到 == 十 1 的 开关 曲线 Yi ,其 集合 表达 
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式 为 


Y={(riyr) | (rm—3) 二 xi=1, zx:<0} (3-222) 
依 上 述 过 程 类 推 ,可 得 一 系列 圆 弧 ,其 一 般 集合 表达 式 为 

7 一 (人 (zlyZy) [Ez 27 十 1) 上 十 zx 二 1 ,Xx 之 0} (3-223) 
7 = {ryr) [r+ (C27 D+zrxi=1,x,>0) (3-224) 

这 些 圆 弧 的 全 体 , 构 成 了 问题 3-6 的 开关 曲线 ,如 图 3-18 所 示 。 和 奉令 
7 ,=U (3-225) 
7_ = UY (3-226) 

则 开关 曲线 为 

/一 外 (UY. (3-227) 


开关 曲线 7 将 相 平 面 分 成 R+ 和 RR- 两 个 区 域 。 于 是 ,问题 3-6 唯一 的 最 优 控 制 律 可 以 表示 为 
* (4) 1 VY (XT ER UY, 
A -一 


(3-228) 
—1], Y (TT ER UY 


图 3-18 问题 3-6 的 开关 曲线 
如 图 3-19 所 示 是 一 条 始 自 有 (zio,za) 凡 的 最 优 轨 线 。 该 轨 线 首尾 两 段 都 是 以 (一 1， 
0) 为 圆心 的 圆 弧 ,其 他 各 段 则 是 以 (十 1,0) 或 (一 1,0) 为 圆心 的 半圆 。 本 例 共 切换 四 次 。 


图 3-19 最 优 轨 线 
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3.3.4 ”离散 系统 的 了 时间 最 优 控制 


对 于 维 线性 离散 系统 , 若 其 状态 是 完全 可 控 的 ,控制 变量 不 受 约束 , 则 时 间 最 优 控 
制 的 特点 是 :最 多 在 个 采样 周期 内 ,可 使 任意 初 态 状态 转移 到 要 求 的 末端 状态 。 如 果 控 
制 变量 受 约束 , 则 使 任意 初 态 状 态 转移 到 要 求 的 末端 状态 所 需 的 采样 周期 数 将 要 增 大 。 

设 线性 定常 离散 系统 的 状态 差分 方程 为 

Xk 二 1)—=Ax(k)BulkR), x(0)=xo (3-229) 
式 中 xE R";uE R", 不 受 约束 ;4 为 非 奇 异 阵 ;系统 完全 可 控 。 要 求 确定 最 优 控制 序列 
2 (k),k 一 0,1,…,N 一 1, 使 系统 (3-229) 在 NN 个 采样 周期 内 ,由 初始 状态 x(0) 转 移 到 状 
态 空间 原点 x(N) 二 0， 
由 系统 方程 (3-229) 可 得 

x(1)= Ax(0) 二 Bul(o0) 

x(2)—=Ax(1)+TBu(l)=Ax(0)+ABu(0)+ Bull) 
以 此 类 推 , 有 


NC—1 
x(N)—=Ax(N—1)+Bu(N—1)=A"x(0)+ > AN «1iBu(k) 
k=0 
令 x(N)= 二 0, 由 上 式 得 


一 1 


X(0) 一 一 4 > 4 Bt) 一 CU (3-230) 
上 一 0 
式 中 
C 一 [一 4 1 一 4-: … —A-»]B (3-231) 
PK (0) 
u” (1) 
一 . (3-232) 
8 (NC—1) 


于 十, 由 已 知 的 x(0) 和 G, 不 难 由 式 (3-230) 求 出 时 间 最 优 控 制 序列 U*， 
例 3-9 设 二 阶 离 散 系 统 为 


的 |! 1—e rx (k) e 一 十 人 一 1 
De 
Z2(& 十 |) 0 eT XT, (Rk) l—e 


T1(0) 之 (10) 
od) 
却 中 x(&) 为 不 受 约束 的 一 维 控制 变量 。 试 求 最 优 控制 序列 w* (48), 使 系统 在 两 个 采样 周 


期 内 ,从 已 知 初 态 转移 到 状态 空间 原点 。 
解 ”根据 题 意 , 有 


由 式 (3-231) 知 
G=lg。 gj=[~A 'b —A-’b] 
= ]06* 


式 中 


Bo 加 e 一 ] 
7 十 e7 一 e22 
5 一 一 4-25 一 一 | | 
e2 一 e 
因 为 
X(0) 一 一 4-15x(0) 一 4 bul(l)=gou(0) gu(l) 
XC1)=Ax(0)Hbu 0) = gou ll) 
于 是 
uw(0) zzCL) 
» se el 
[xC0) x(1)J=Lg。 g1J ul) 0 
代入 Bo 及 5 1 表达 式 , 可 得 
el 一 e2 了 十 ef 一 e2 
Wt “1- T(1i+e’—2e’) T(+e’—2e7) 鸯 网 | 
ul(1) 0 e:! 一 ] e “一 了 一 1 ZooC0) wx,(1) 
(1 十 e2 一 2e ) T(1le’'—2e’) 
由 上 式 得 时 间 最 优 控制 律 为 
, 加 eT 一 e2 Te —e? 加 
u (Rk)— TT ar) TR) TT er or k=0,1 


根据 上 述 时 间 最 优 控制 律 ,可 以 实现 闭环 负 反 馈 控 制 。 和 在 取 采 样 周 期 了 三 1s, 则 有 
2 (R) 一 一 1.5827i(8) 一 1.24373(R)， R= 一 0,1 
系统 可 在 两 个 采样 周期 ( 计 2s) 内 ,从 任意 初 态 x(0) 转 移 到 状态 空间 的 原点 ,其 控制 方块 
图 如 图 3-20 所 示 。 


图 3-20 例 3-9 系 统 时 间 最 优 控制 方块 图 
若 取 采样 周期 了 一 0. 1s, 则 有 


2 (k)=—105.054z(k)—14.673zx,(k), k=0,1 
根据 这 一 控制 规律 ,系统 由 任意 初 态 转移 到 状态 空间 原点 所 需 的 时 间 将 不 超过 0. 2s， 
但 所 需 控 制 信 号 x(&) 的 强度 将 极 大 地 增加 。 然 而 ,一 个 实际 的 物理 系统 能 够 提供 的 控制 
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信号 强度 总 是 有 限 的 ,所 以 将 系统 由 任意 初 态 转移 到 状态 空间 原点 所 需 的 最 短 时 间 不 能 
任意 缩短 。 


3.4 ”燃料 最 优 控 制 


在 工程 实际 中 ,和 常 彰 需要 考虑 使 控制 过 程 中 所 消耗 的 能 量 最 小 .在 现代 的 航空 与 航天 
技术 中 ,从 人 简单 的 姿态 控制 到 复杂 的 拦截 问题 或 会 合 问题 ,大 多 采用 燃烧 燃料 所 形成 的 推 
力 或 力矩 进行 控制 ,因此 ,使 控制 过 程 中 的 燃料 消耗 为 最 小 ,不 但 可 以 降低 起 飞 重量 、 节 省 
成 本 ,而且 能 确保 安全 航行 

右 以 非 负 量 2( 思 表示 燃料 的 瞬时 消耗 率 , 则 控制 过 程 中 所 消耗 的 燃料 总 量 为 

F=| po)d: (3-233) 


道 常 ,燃料 消耗 率 Vi) 与 控制 向 量 wz) 的 确定 关系 可 由 实验 确定 。 这 里 , 仅 考虑 如 下 形式 
的 关系 


FO)= Dolwt)l, cj;>0 (3-234) 


式 中 uj(t) 是 m 维 控制 向 量 uC4) 的 第 j 个 分 量 jc 为 比例 系数 , 称 为 比 耗 。 若 运动 过 程 中 低 
料 消耗 量 相 对 系统 的 总 质量 可 以 略 去 不 计 , 则 系统 质量 可 视 为 常数 ,为 了 保证 控制 过 程 中 
最 省 燃料 ,选择 燃料 消耗 总 量 作为 性 能 指标 


7=| Sw) dt (3-235) 


由 于 燃料 最 优 控制 问题 的 性 能 指标 比较 复杂 ,因此 燃料 最 优 控制 的 理论 研究 也 比较 
困难 。 本 市 仅 以 二 次 积分 模型 为 例 来 说 明 燃 料 最 优 控制 问题 。 

问题 3-7 已 知 二 次 积分 模型 的 状态 方程 

z(t) = Zz,(t) 
人 61 
求 满足 约束 条 件 

zeCDI<1，VieEro (3-237) 
的 最 优 控 制 uw (2) ,使 系统 (3-236) 由 任意 初 态 (&,,6,) 转 移 到 状态 空间 原点 (0,0), 且 使 性 


能 指标 
7=| lu ldt (3-238) 


为 最 小 。 衣 末 端 时 刻 tr 目 由 。 
由 于 控制 受 约束 , 且 性 能 指标 中 的 被 积 函数 对 zx 不 是 处 处 可 微 , 因 此 无 法 用 变 分 法 求 
解 问题 3-7, 只 能 用 极 小 值 原理 求解 。 根 据 极 小 值 原理 ,问题 3-7 最 优 解 的 必要 条 件 为 
J 正则 方程 。 令 哈密 顿 函 数 
H= |z(G)| Ar) ud) (3-239) 
则 有 
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aH 9H 


XX 二 一 一 二 多， A 二 一 一 0 
A 9 Ti 
0 ， (3-240) 
.a | gf 
2 2 Drz 
@) 边界 条 件 
1 0) 二 8 二 0 
人 ) 一 、 人 (3-241) 
zx,(0)=é, X(t1)=0 
(3) 极 小 值 条 件 
[a 0) | Au (DIC) | A, (ul) (3-242) 
由 瑟 隐 数 变化 律 
a” (0) | FA Cr CA, Gu” (7) 
一 |z (7) | 二 A Ct) ra Cr) 十 人 (tr)z (ty)=0 (3-243) 
由 式 (3-242) 知 ,五 函数 对 最 优 控制 w* (七 取 极 小 值 , 等 价 于 函数 
Ru) = lu) |+A, (u(t) (3-244) 


对 最 优 控制 u* (2) 取 极 小 值 。 令 0 和 xb 委 1 及 一 1 二 wu(1) 二 0, 得 RR(w) 与 和 (1) 的 关系 如 
图 3-21 所 示 。 由 图 可 见 , 使 RLw) 取 下 边界 的 控制 为 最 优 控制 uw* (2) ,其 与 和 () 的 关系 如 
图 3-22 所 示 。 图 3-22 表明 了 ww* (4) 与 和 (1 的 大 小 及 符号 有 关 , 呈 如 下 死 区 函数 关系 : 


u=+] 


图 3-21 R(w) 与 4,(1) 关 系 图 


A2 (7) 


图 3-22 zx 4) 与 4) 关系 图 
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(LI) 一 十 ]， 当 4,(2)< 过 一 1 


u(t)=0,， 当 一 1<< (1) 过 十 1 
u* (1t)=—1, 当 A,(1) 守 十 1 (3-245) 


Ou" (1)&1, 当 4,(1)=—1 
一 1<xi (4) 之 0， 当心 (划一 十 1 
为 了 书写 简单 ,引入 死 区 图 数 记 号 dez, 其 意义 为 


2 一 dez{p)} 
表 不 
0， 当 |6|<1 
[nb ， 当 |b| 半 1 
以 及 


0 过 a 志 1， 当 2 一 十 1 
i, 当 5 二 一 1 
于 是 ,最 优 控 制 律 (3-245) 可 表示 为 
2U (ti 一 一 dezlA (zt)) (3-246 ) 
由 陈 (3-245) 关 系 能 否 完全 确定 上 (1) ,取决 于 函数 A(1) 的 性 质 。 与 时 间 最 优 控 制 问题 类 
似 ,燃料 最 优 控 制 问题 也 可 以 区 分 为 正常 与 奇异 两 种 情况 ;车 在 时 间 区 间 [0,t/]j 内 , 14.0)|=1 
只 在 有 限 点 上 成 立 , 则 问题 属于 正常 情况 ,最 优 控制 x* (2) 可 取 一 1.0, 十 1 三 个 值 ,随时 间 
的 增长 ,xu* (4) 在 这 三 个 值 上 转换 , 称 为 三 位 控制 或 开关 控制 ,如 图 3-23(a) 所 示 , 若 至 少 存 
在 一 段 时 间 间 隔 [z ,ts jCCL0,tyj, 在 其 上 有 |N 和 (i) | 二 1, 则 间 题 属于 奇异 情况 ,如 图 3-23 
(b) 所 示 , 这 时 x (2) 在 奇异 时 间 间 隔 上 的 值 不 能 由 极 小 值 原理 求 出 ,其 最 优 轨 线 由 正常 
吸 段 与 奇异 弧 段 组 成 。 


(站 a(t) 


奇异 时 奇异 时 
由 间 ] 隐 问 则 陋 
(b) 


图 3-23 燃料 最 优 控 制 的 正常 与 奇异 情况 


对 于 问题 3-7, 为 了 确定 最 优 控 制 u* (2), 和 需要 求解 %(2) ,在 式 (3-240) 中 ,对 协 态 方程 
积分 ,得 
At 一 人 (0) 一 const 
Mt 一 4(C0) 一 个 (CO0) 
却 中 心 (0) 和 (0) 为 协 态 初 始 条 件 。 根 据 为 (0) 和 力 (0) 的 数值 情况 ,wx* (4) 或 为 奇异 控制 ， 
或 为 正常 控制 。 


(3-247) 
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(1) 奇 异 情 况 
若 1(0)=0, 为 满足 式 (3-243) 表 示 的 瑟 :(O=0, 应 有 几 (0)| 三 1 一 1。 这 时 ,由 
式 (3-245) 仅 能 决定 w* (b 的 符号 ,而 无 法 确定 其 数值 。 燃 料 最 优 控制 果 数 上 (是 襄 异 
的 ,其 规律 由 如 下 命题 确定 。 
命题 3-1 行 辣 (二 40) 一 0 一 |0)|=1 VEL0: ,定义 不 便 为 零 的 
非 负 分 段 连续 肾 数 集 
Vt= {v1) |0Rv() R11,Y t€EL0,t] ,v(t)A0) (3-248) 
则 在 14;(2)1= 二 1 两 种 奇异 情况 下 ,燃料 最 优 控 制 的 候选 函数 为 
u(t)=—sgnid,(0)}v() (3-249) 
证 明 将 命题 已 知 条 件 及 式 (3-249) 代 入 哈密 顿 函 数 (3-239) ,可 得 
H=v(t)—v()=0, YIGELO:z 
表明 在 命题 假设 条 件 下 , 式 (3-249) 满 足 极 小 值 原理 全 部 必要 条 件 , 故 是 燃料 最 优 控制 函数 。 
(2) 正 常情 况 
硅 久 (0) 关 0, 则 (2) 二 如 (0) 一 和 .C0)z 是 时 间 t 的 线性 沙 数 。 这 时 , ,0) | = 二 1 至 多 在 两 
个 孤立 时 刻 成 立 ,因而 燃料 最 优 控制 函数 x * (2) 是 正常 的 ,为 三 位 控制 , 且 最 多 有 两 次 切换 ， 
命题 3-2 大 加 (0) 天 0, 则 以 下 九 种 控制 序列 为 燃料 最 优 控制 候选 函数 
410}, 《十 1 (一 1] (人 十 1,0)， 
{一 1,0),{0, 十 1},{0, 一 1)， 
{十 1 ,0, 一 1),{( 一 1] ,0, 十 1)} 
证 朋 因为 姑 (2)== 和 (00) 了 关 0, 四 惧 ) 二 丸 (0) 一 和 00) 所 以 | 加 4) |==1 至 多 在 两 个 孤立 
时 刻 成 立 。 由 式 (3-245) 知 ,燃料 最 优 控制 候选 函数 为 
“oO 当 |14 (<1 
—sgn(4z(1)}， 当 |4( 人 (| 二 1 
芯 即 可 得 命题 结论 中 九 种 控制 序列 。 
应 当 指 出 , 当 * 王 0 时 ,由 系统 方程 (3-236) 知 ,其 相 轨迹 斜率 dzy*/dz; 一 0, 状 态 轨 线 如 
图 3-24 所 示 。 这 是 一 簇 不 通过 原点 的 平行 直线 ,或 是 x 轴 上 的 孤立 点 。 因 此 ,命题 3-2 中 
的 九 种 控制 序列 中 ,以 w==0 结尾 的 三 种 控制 序列 {0}, {十 1,0), {一 1,0} 不 可 能 是 最 优 控 
制 。 于 是 ,可 能 的 最 优 控制 序列 只 有 下 列 六 种 : 
{ 十 1) {一 1),{0, 十 1)},{0, 一 1]})， 加 
{十 1,0, 一 1),{ 一 1,0, 十 1)} (3-250) 
下 面 的 命题 给 出 了 判断 燃料 最 优 控制 序列 的 
必要 条 件 。 
命题 3-3 设 J' 表示 在 某 一 时 间 tj 内 使 系 


统 (3-236) 由 任意 初 态 (&,,&,) 转 移 到 末 态 C0,0) 所 5 
需 的 最 少 燃料 消耗 量 , 则 /应 满足 下 列 关系 式 ， 
六 之 | 名 | (3-251) 
证 明 因为 
Zt) =—wu(t) 图 3-24 w==0 时 的 状态 轨 线 
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所 以 
Ty (= 名 十 | xc)dr 
由 假设 条 件 ztr) 王 0, 故 得 
&,= 一 | ud 
从 而 有 
=| zc df= 


|&,|= [ca 


该 命题 表明 , 若 能 找到 一 个 控制 函数 u(z) ,使 系统 (3-236) 由 初 态 (51,6,) 转 移 到 坐标 
原点 , 且 所 耗 燃料 为 18;|, 则 该 控制 必定 是 燃料 最 优 控 制 w" (#)。 

为 了 进一步 分 析 燃 料 最 优 控制 解 的 属性 ,对 系 
统 (3-236) 进 行 相 平 面 分 析 。 当 ww 二 十 1 和 w= 一 1 
时 ,系统 (3-236) 由 初 态 转移 到 坐标 原点 的 两 条 轨 线 
为 Yo 与 7 ,如 图 3-25 所 示 ,其 点 集 表达 式 为 


Yo+ 一 | (x1,X2) |z1 = pt as0| 


70_ 一 | (Ziyzz) | zi 一 -0 
(3-252) 
图 3-25 开关 曲线 Yo+ 和 7。- 或 者 
”一 yo+ UY = | (Xz1»72) |z1 = 一 地 | za | | 
(3-253) 


曲线 7Y 及 坐标 轴 zi 将 相 平 面 分 成 如 下 四 个 区 域 . 
R= | (Zi T2) zi> 一 地 | zs | ;TX2>0 


Re 一 人 (zzo1z<< 一 去 za|zz|,zo>>0 | 
(3-254) 
R= | (ziyzs)1zi<< 一 到 zzlzal,za<c0 | 


R= {zisz2) 171>— Fz | ,zr<0 


当初 态 位 于 不 同 区 域 时 ,最 优 控制 律 是 不 同 的 ,下 面 分 别 讨论 。 
(1) 初 态 位 于 开关 有 曲线 7 或 7 上 时 
命题 3-4 对 于 问题 3-7, 若 初 态 (&1 ,6,) EY, 则 w* (一 十 1 是 燃料 最 优 控制 , 且 唯 


证 明 大 (0) 关 0, 则 命题 3-2 成 立 , 但 在 式 (3-250) 所 示 的 六 种 最 优 控制 候选 函数 
中 ,只 有 一 {十 1) 能 使 (61,E,)EY 到 达 坐 标 原 点 ，。 
在 由 (0) 一 0,|4(0)| 一 1, 则 命题 3-1 成 立 , 候 选 最 优 控 制 函 数 为 
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u(t)=—sgn{(A Ov Vou)EV 
由 状态 方程 (3-236) 可 解 得 始 于 ($1 ,$s) E74 的 状态 轨 线 
Xx'1(t) 一 和 十 人 十 | dr| [一 sgn(2(O) }vu(o) jdc 


(3-255) 
xD 一 名 十 | [~—sgn{h (0)}vl) dr 
邻 zi 和 (是 状态 方程 (63-236) 在 (ee )EG7 ,u(t)= 二 十 1] 时 的 解 , 有 
1) = + 人 十 | dr| ldo 
0 0 
(3-256) 


TX, (1) = é, + | 1dr 
由 式 (3-255) 和 式 (3-256), 可 得 
x (一 zi 一 | dr| 0 Fsgn {Xa(0))}v(o) Jdo>0 (3-257) 


因为 z1()EYo4 ,元 w() 二 一 sgn {4h(0)}v(t) 形 成 的 状态 轨 线 xii) 必 位 于 7 之 左 , 而 不 
通过 坐标 原点 ,所 以 不 是 最 优 轨 线 。 
当 且 仅 当 
zt 一 一 SgntazC0) 和 (一 十 ] 
zi 和 zi 分 别 与 x1) 和 x(t) 重 合 ; 故 (2) 二 十 ] 是 唯一 的 。 
者 将 x2Cty)= 二 0 代入 式 (3-256), 得 


"=|1 dt= |é, | 


根据 命题 3-3,u* (4) 二 十 1 是 (5 ,6,) E74 时 唯一 的 燃料 最 优 控制 。 
同 理 , 当 (61,6,)EY_ 时 ,u" (41) 二 一 1 是 使 系统 (3-236) 由 (C8),é;) 转 移 到 状态 空间 原 
点 唯一 的 燃料 最 优 控制 。 
(2) 初 态 位 于 区 域 R, 或 R, 内 时 z 
命题 3-5 对 于 问题 3-7, 若 初 态 (§1,6,)ER,;, 则 w* 4)=={0, 十 1) 是 燃料 最 优 控 制 。 
证 明 由 命题 3-2, 在 式 (3-250) 表 示 的 六 种 候选 控制 序列 中 ,只 有 
zt 一 (0 十 1) 
zt 一 (一 1;0, 十 1 ) 
可 将 状态 转移 到 坐标 原点 ,相应 的 状态 轨 线 如 
3-26 所 示 。 
由 于 在 4B 段 及 CD 段 内 w=0, 不 消耗 燃 
料 , 有 
46 一 cp 一 0 
而 在 BO 段 及 BD 段 内 zx 一 十 1, BEX 及 DE 
Yo+ ,由 俞 题 3-4, 有 
Jao 一 Jpo 一 18 | 


3-26 ”到达 原点 的 状态 轨 线 


因此 
J(z 一 J ag 十 J po 二 |é, | 
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J (1) =act ent Joo=|" | —1 1dz 十 | &, 一 十 | 
根据 式 (3-256), 上 式 可 写 为 
(uu ) 一 |zzc 一 6 人 | 十 | 人 全 | 
于 是 ,xz 王 (0, 十 1) 为 燃料 最 优 控制 ,已 点 为 切换 点 。 
熙 取 x(t 世 一 v(， 代 人 系统 状态 方程 (3-236), 则 有 
| vdo=—& (3-258) 
[ar| v0)do=—& —é (3-259) 


由 于 姑且 由 ,所 以 可 找到 许多 非 负 分 段 连续 函数 (ET ,使 之 满足 式 (3-258) 和 式 (3- 
259) 。 由 式 (3-258) 可 见 , 满 足 上 述 条 件 的 控制 (一 z( 约 都 能 使 系统 转移 到 坐标 原点 , 且 
燃料 消耗 最 少 。 例 如 , 取 w(t) 二 v(t), 如 图 3-27(a) 所 示 ,适当 选择 开关 时 间 女 , 包 ，.. ,总 
可 使 状态 轨 线 通过 坐标 原点 ,如 图 3-27(b) 所 示 。 实 际 上 ,x 一 {0, 十 1} 也 包含 在 这 些 解 


中 。 由 于 
=| ‘di=| fed= de -| 1 0 (3-260) 


£1 2 [zs | 
对 于 相同 的 积分 区 间 ,|zz| 大 的 最 优 轨 线 转移 时 间 小 ,所 以 在 众多 的 燃料 最 优 控制 解 
中 ,以 zw (4) 二 {0, 十 1) 所 需 的 时 间 最 短 ，。 


1 fr iF ly 


(a) 
图 3-27 ww()= 二 v(t) 形 式 与 状态 轨 线 

同 理 , 当初 态 (61 ,6.)E€ Rs 时 ,u* (一 (0, 一 1) 是 转移 时 间 心 最 短 的 燃料 最 优 控制 。 
(3) 初 态 位 于 区 域 Ri 或 R, 内 时 

设 (6,6)ER, 若 燃料 最 优 控制 存在 , 必 有 
J "三 |;| .车 命题 3-2 成 立 , 则 在 式 (3-250) 所 示 的 
入 种 候选 控制 函数 中 ,只 有 x( 世 =( 一 1,0, 十 1} 可 
将 系统 转移 到 坐标 原点 ,如 图 3-28 所 示 。 

可 以 证 明 , 此 时 所 消耗 的 燃料 总 大 于 |&,|, 因 
此 严格 地 说 ,u(t)= 二 {一 1,0, 十 1) 不 是 燃料 的 最 优 
/ 控制 。 
图 3-28 -燃料 最 优 控制 轨 线 车 采用 w(t) 二 {一 1,0), 则 系统 先 在 = 一 
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作用 下 ,将 状态 转移 到 x 轴 上 时 所 耗 燃料 正好 为 所 ,相应 的 状态 坐标 可 记 为 (ae,0); 然 后 
取 zx=0, 系 统 不 再 消耗 燃料 ,但 状态 会 保持 在 (ce,0) 点 不 动 , 不 能 到 达 原 点 (0,0)。 还 可 以 
验证 ,采用 式 (3-250) 和 式 (3-249) 表 示 的 任何 控制 ,在 消耗 掉 燃 料 J "= 二 1&,| 之 后 , 均 只 能 
将 状态 转移 到 比 (a,0) 距 原点 更 远 的 地 方 。 因 此 ,当初 态 (61 6) 位 于 Ri 区 域内 时 ,燃料 最 
优 控 制 问题 无 解 。 

可 以 证 明 , 当 (1,6,)E Ri 时 ,采用 u()= 二 {一 1,0, 十 1}) 哩 然 得 不 到 燃料 最 优 控 制 解 ， 
但 却 可 以 获得 e- 燃 料 最 优 控制 解 。 

全 题 3-6 ” 夺 初 态 ($1,6,)E€ Ri, 则 对 于 给 定 的 任 一 se 盖 0, 使 系统 (3-236) 由 (6 ,2 ) 到 
达 原 点 , 且 燃 料 消耗 量 为 

J 一 | 名 | 十 e (3-261) 
的 e- 燃 料 最 优 控 制 为 
2U (1) 二 {一 1,0, 十 1]) 

证 朋 让 w(z)=={ 一 1,0; 十 1) ,状态 轨 线 如 图 3-28 所 示 。 在 区 域 R; 中 , 距 zi 轴 /2 

处 定义 集合 


7 一 人 xz ,x,) 一 一 到 > | (3-262) 


式 中 zx 之 e*/8 是 因为 切换 点 刀 位 于 开关 线 7,， 上 ,而 X。, 满 足 的 方程 为 
一 
当 zz 一 一 e/2 BT ,zip=e /8.。 


”在 最 优 轨 线 A4CDO 上 ,各 段 所 耗 燃 料 可 分 别 计算 如 下 : 


4C 段 

&U tt) 一 一 1 

Z(t)=u(t)=—]1 

z(t)= 名 十 | (—1)d 

roc(D) 一 名 十 | (—1Ddi= 一 六 

J Ac 一 ba = |é&,| 十 了 
CD 有 段 

u(t)=0, Jcp=0 

DO 段 


zw tt) 一 十 ] 
zz.(t) 二 w(t) 二 十 1 


7 (tr ) 一 zzo 十 | ldt 二 0 
iD 
J po 一 了 了 az 


于 是 ,党 e- 最 优 轨 线 4CDO 的 燃料 消耗 量 为 


-一 [azD| 一 二 
2 
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一 .ce 十 cp 十 Jpo 一 | 全 | 十 e 
同 理 , 当初 态 (&1,&,)€ Rs 时 ,燃料 最 优 控制 问题 无 解 ,但 存在 e- 燃 料 最 优 控制 x* (2) 
二 {十 1,0, 一 1}。 
综 上 所 述 , 可 得 问题 3-7 的 燃料 最 优 控制 律 
十 1， VY (Xi TXT2) EY 
一 1， VYV (Xi,X2)EYo 
w” (t) 一 0， Y (2.,£) ER UR, (3-263) 
无 解 ， VY (zx,7x) ERIUR; 
应 当 指 出 ,上 述 控制 律 同时 也 保证 了 转移 时 间 为 最 小 。 夺 不 考虑 转移 时 间 , 则 (5 ,é&,) 
EY 有 唯一 解 , (61,6,)E€ RsUR, 有 无 穷 多 解 , (6, ,6,) € RiU R; 无 解 。e- 燃 料 最 优 控制 问题 
昌 存 在 最 优 解 , 但 因 从 C 点 到 DD 点 的 转移 时 间 为 icp 二 2a/e, 从 而 使 系统 总 转移 时 间 过 


长 。 
3.5 时间- 燃料 最 优 控 制 


单纯 以 节省 燃料 为 目标 的 燃料 最 优 控制 问题 ,往往 使 得 系统 的 响应 太 慢 ,不 满足 实际 
使 用 的 要 求 .看 将 缩短 时 间 与 节省 燃料 加 以 综合 考虑 , 则 所 设计 的 控制 系统 既 能 节约 燃料 
又 不 全 于 啊 应 缓慢 ,因而 产生 了 时 间 - 燃 料 最 优 控制 问题 。 一 种 较 好 的 处 理 方法 是 在 燃料 
最 优 控制 性 能 指标 中 增加 时 间 的 加 权 项 ,得 到 


/pwt |, > ld 一 | pt 2 wD 1)d (3-264) 


式 中 >0, 为 时 间 加 权 系 数 ,表示 设计 者 对 啊 应 时 间 的 重视 程度 ， 各 取 p= 二 0, 表 示 不 计 响 
应 时 间 长 短 , 只 考虑 节省 燃料 ;者 取 po 一 co, 表示 不 计 燃 料 消耗 ,只 要 求 时 间 最 短 。 因而, 燃 
料 最 优 控制 和 时 间 最 优 控制 都 是 时 间 - 燃 料 最 优 控制 的 特例 。 
目前 ,时 间 - 燃 料 最 优 控制 理论 尚 不 完善 , 仅 对 二 次 积分 模型 问题 有 解析 结果 ,并 可 用 
极 小 值 原理 求解 。 本 节 仍 以 二 次 积分 模型 为 例 来 讨论 时 间 - 燃料 最 优 控制 问题 。 
问题 3-8 已 知 系统 的 状态 方程 
ZL1(t) = x,(t) 
z(t)—=u (lt) 


(3-265) 


求 满足 下 列 约 束 条 件 : 

[zi 委 1， VtELO,ty] (3-266) 
的 最 优 控 制 u" (#) ,使 系统 (3-265) 由 任意 初 态 (&,,&,) 转 移 到 状态 空间 原点 (0,0), 且 使 性 
能 指标 


J=| (pt Ci [di (3-267) 


为 最 小 。 设 末端 时 刻 tj 自由 。 

此 问题 属于 定常 系统 、 积 分 型 性 能 指标 .tj 自由 和 末端 固定 的 最 优 解 问题 。 具 体 求解 
之 前 ,应 首选 进行 奇异 性 判断 ,以 便 确定 可 否 由 极 小 值 原理 确定 其 最 优 控 制 律 。 令 哈密 顿 
滑 数 
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五 王 0 十 jz 十 四 za 十 A2z (3-268 ) 
与 上 节 类 似 , 由 极 小 值 条 件 可 得 


u* (1)=— dez{A,(t)) (3-269) 
根据 协 态 方程 
oau 
(4)= 一 全 二 0 
DT a (3-270) 


A (1) 一 一 5 守 一 一 AI (¢) 
假定 初始 协 态 为 (0) 和 4,(0), 解 得 
A1(t)=A(0)=const (3-271) 
At) 一 人 0) 一 MGCO)E 
因为 态 不 显 含 i, 且 tj 自由， 人 
H’*=po++|u’ |+Azrt +hu’ =0 (3-272) 
式 中 p 放 0,|u" | 实 0。 由 式 (3-272) 知 ,必用 (1) 与 和 (4) 不 同时 为 零 , 否 则 矿 * 汪 0, 再 由 式 
(3~-271) 知 ,和 C0) 与 4,.(0) 必 定 不 同时 为 零 。 
夺 令 和 (0) 二 0,A 和 (0) 关 0, 则 入 (1)== 和 (0) 二 const, 且 必 有 入 (0) 关 土 1, 否 则 由 
式 (3-269) 知 
& (tf)=— |u’ GG) |sgn{A,G)} 
再 将 入 (2)、A 和 G4) 和 ww 4) 代 人 式 (3-268), 得 
H’*=p+ lu 0)|— lu G)|=0>0 
这 与 条 件 (3-272) 相 矛盾 。 
夺 令 4.(0) 二 0,A4(0) 隆 0, 则 和 (4) 二 一 如 (0)z 为 直线 方程 ,与 上 轴 只 有 孤立 交点 ,不 存 
在 奇异 时 间 间 隔 。 
在 令 如 (0) 关 0,42(0) 关 0,; 则 和 G4) 二 (0) 一 A.(0)z 也 是 直线 方程 ,也 不 存在 奇异 时 间 
间隔 。 因 此 ,问题 3-8 是 正常 的 ,其 时 间 - 燃 料 最 优 控 制 必定 是 三 位 控制 。 
由 3.4 节 分 析 可 知 , 当 入 (2) 和 (2) 满足 关系 式 (3-271) 时 ,如 下 六 种 控制 序列 为 候选 
最 优 控 制 序 列 
{十 1}, (一 1},{0, 十 1}， 
40, 一 1),{ 十 1,0, 一 1),{ 一 1],0, 十 1) (3-273) 
式 中 后 两 种 控制 序列 具有 代表 性 ,前 四 种 情况 均 为 这 两 种 情况 的 特例 。 
为 了 具体 确定 最 优 控制 律 ,下 面 采用 相 平 面 法 分 别 讨论 wu' (2) 二 {一 1,0, 十 1} 和 和 
u" 《1) 一 《十 1,0, 一 1} 的 开关 曲线 及 其 集合 表达 式 。 
(1) wu"'()= 二 {一 1,0, 十 1} 的 开关 曲线 
由 式 (3-271) 知 , 当 取 wu' () 二 {一 1,0, 十 1}) 时 ,应 有 
: A(t)=A(0) 
A C(t) =A,00)— A C0) 
A,(t)=—A(0)<0 
因此 ,wu* (2) 与 (#) 的 关系 及 相应 的 状态 轨 线 如 图 3-29 所 示 。 根 据 图 3-29, 可 以 确定 
2 (1) 二 (一 1,0, 十 1} 对 应 的 开关 曲线 。 
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uw (1t) 二 十 1， tect<ty 


tait) 一 zt 一 十 


图 3-29 2 (划一 (一 1,0, 十 1) 及 其 状态 轴线 
可 得 过 相 和 平面 原点 的 相 轨 迹 方 程 为 


zc (1D) = 地 xi) 


上 式 表明 ,CO 段 为 抛物 线 。 因 而 ,wu* (1) 从 0 切换 到 十 1 的 开关 曲线 为 


Yo 一 (z1,72) |z1 = X20 
由 BC 段 
2&U (ft)—=0, ts<t<ite 
从 状态 方程 
TI1(t)=7z2(t), Z(t)=0 
解 得 


Xs 二 Xzc 二 TB—=const 
ic 一 TI18 一 TackCtc 一 绍 ) 
由 图 3-29 可 见 ,t 和 tc 分别 为 和 二 1 和 二 一 1 时 的 转换 时 刻 , 故 令 
X(t8) = (0)—A (0)ts=++1 
上 (tc) 一 (0) 一 人 0)ic 一 一 ] 
解 得 
2 


‘cls C0) (0) 


再 根据 条 件 (3-272), 当 w" 一 0 时 ,应 有 
已 三 0 十 CO)Zazc 一 0 
求 出 
vt 


将 式 (3-276) 和 式 (3-277) 代 人 式 (3-275) ,可 得 
*。 118: 


(3-274) 


(3-275) 


(3-276) 


(3-277) 


2 
zs zc (3-278) 


由 于 点 C 位 于 yo+ 上 , 必 满 足 


将 上 式 代 人 式 (3-278), 有 


十 4 
Te 一 人 X28 (3-279) 


若 以 7_, 表 示 B 点 所 在 的 开关 曲线 , 则 式 (3-279) 表 明 ,; 这 是 一 条 通过 原点 的 抛物 线 。 于 
是 ,wu* (tt) 从 一 1 切换 到 0 的 开关 曲线 为 


7Y_,=( (x ,Ta) 0 (3-280) 


上 述 分 析 表 明 , 从 相 平 面 上 4 点 开始 的 时 间 - 燃 料 最 优 控 制 为 u* (6 一 《一 1,0, 十 1 
状态 由 4 点 出 发 , 沿 抛 物 线 4B 运动 ,至 开关 曲线 7Y_o 时 ,发 生 由 = 二 一 1 到 w= 二 0 的 转换 ， 
然后 状态 沿 平 行 于 zi 轴 的 直线 BC 运动 ,到 开关 曲线 XY ;时 发 生 由 = 二 0 到 Ww 二 十 1 的 第 
二 次 转换 ,最 后 状态 沿 抛 物 线 CO 运动 ,直至 坐标 原点 。 

(2) a* (区 一 (十 1,0, 一 1} 的 开关 曲线 

通过 类 似 的 分 析 , 可 得 相应 的 两 条 开关 上 曲线 为 


7 一 | (Xi, TX,) jz 一 一 到 好 ,>0| (3-281 ) 
/+ 一 | (X172) |z1= -0| (3-282) 
夏令 
y=7,, UY, = [czoplzm= 一 到 zlzal| (3-283) 
Y=7Y,6 7Y_,= Cern) ni=— 7 lz | (3-284) 


则 开关 曲线 7Y 和 7, 将 相 平 面 分 成 RI、R;、R, 和 Rs 四 个 区 域 ,如 图 3-30 所 示 。 各 区 域 定义 
如 下 : 


(X1 Ta ) Zi 之 一 


4 
pint | -2 | > | | | 


1 


1 (Xi 9 2) 区 1， | > 2 iz | 


2 
] 4 
(Zi 2Z2) [Tt 一 Fz x | ,1 |z, | 
RK = fe » T2 ) zt1> 一 地 | < Es | (3-285) 


在 上 述 区 域 划分 中 ,Ri 恬 70- ,Ri 汪 74o,R 必 Yot RD。 因而 ,问题 3-8 的 时 间 - 燃 料 最 优 
控制 律 为 


一 4340， vy (Xi ,TX2) ER, UR, (3-286) 


z 十 1， vy (Xi1 ,TX2) ER, 
2 o-| 
一 1]， vy (Xz ,TXT2) ER 
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图 3-30 ” 相 平面 上 的 区 域 与 开关 曲线 
在 上 述 二 次 积分 模型 的 时 间 - 燃 料 最 优 控 制 律 中 ,在 令 时 间 加 权 系 数 co-co, 必 有 
p+4_1. {1,2\_1 
25 =lim| 十 


lim 
Proo roo 


故 开 关 和 曲线 7 集合 表达 式 变 为 


] 
/一 | Criss) [zi 二 一 二 Xs | zx, | | 


2 
正好 与 开关 曲线 重合。 开关 曲线 7 将 相 平 面 分 成 两 个 区 域 


人 :一 [ceo > 一 到 zalza| | 


2 pop) 2 


kK;= | (XTi,X2) Ee |z; | | 


最 优 控制 律 则 变 为 


1 vy (Xi1s Ta) ERUY. 
u” (ti) 一 
一 1， VY (zz,)ER UY 


(3-287) 


(3-288) 


(3-289) 


式 中 Yi 由 式 (3-274) 定 义 ,7- 由 式 (3-281) 定 义 。 式 (3-289) 表 示 的 结论 ,正好 是 二 次 积分 


模型 的 时 间 最 优 控制 律 。 
将 式 (3-284) 表 示 的 开关 曲线 7, 的 约束 方程 
志 ] 一 CT 十 4 x， | 
25 
写 为 


一 22zl 一 (oO 十 4)zz|zz| 
令 o=0, 则 开关 曲线 的 约束 方程 变 为 
TX; 二 0 
于 是 


Y= 1{ (zr, Xx) |z 一 0) 一 2 


表明 在 相 平 面 上 ,7 与 zi 轴 重 合 。 区 域 R,、R,、R 和 R, 的 定义 与 式 (3-254) 相 同 ,最 优 控 


制 律 同 式 (3-263) ,成 为 燃料 最 优 控制 。 


上 述 分 析 表 明 ,时 间 - 燃 料 最 优 控制 是 比 单纯 燃料 最 优 控制 和 单纯 时 间 最 优 控制 更 广 
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泛 的 一 类 控制 。 燃 料 最 优 控制 和 时 间 最 优 控制 都 是 时 间 - 燃 料 最 优 控制 的 特例 。 
例 3-10 已 知 二 阶 系统 的 状态 方程 和 边界 条 件 
TZ1(t)=u(t), XT1(0)=2, x1(8)=0 
Tt)—x(t), TO0) 一 2， zi(8)=0 
控制 约束 :|x()| 委 1。 求 以 切换 时 间 表 示 的 最 优 控制 4 () ,使 下 列 <- 燃料 消耗 量 : 
7 一 | lecold: 
为 最 小 ,并 求 出 -最 小 燃 耗 J" 。 


解 令 哈 密 顿 因数 
H= |ul| 十 人 2 十 2 


由 协 态 方程 
A (1) 一 一 5 和 一 —As (1) 
解 得 
A(1) = 0) — A C0) 
As (1) = A,(0)=const 
由 极 小 值 条 件 ,得 


“Wd 当 |41(2) | 过 1 
—sgn{iA4(t)}， 当 |AG)|>1 
因为 初 态 (6 ,6,) 二 (2,2) ER,, 故 e- 燃 料 最 优 控 制 为 
(1)= {一 1,0, 十 1} 
设 w* (4) 的 切换 时 间 为 t 和 zi,, 则 有 
由 当 0 委 4< 时 ,u== 一 1, 初 态 为 (61,&,)。 由 状态 方程 
fit) 一 XU 一 一 1， zi) 一 Zi) 
解 得 
Zit) 一 一 上 十 名 
za(D) 一 一 记 纪 十 6 十 名 


@) 当 三 委 i< 时 ,xz 一 0, 初 态 为 
Xi1(t1) 二 一 上 十 友 
Ts) 二 一 也 #f 十 和 ti 十 外 
由 状态 方程 
t] (£1)=w=0, Z(t) = rlt) 
解 得 
ZIti) 一 iD) 一 一 右 十 二 
裤 一 (0D GE 一生) 十 za 人 一 (一 二 十 和 (一 二 ?一 志和 十 各 十 名 
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@) 当世 1 入 tj 时 ,uw 二 十 1 初 态 为 
属 ] (ts) 二 =X] (1 ) 一 一 右 十 如 


A (zt ) -一 (一 站 十 名) (一 加 一方 各 十 6 十 和 


ZI) 一 2 一 十 1， X(t) = X(t) 


Xi(t) 一 代 一 加) 十 (一 所 十 后 ) 
六) 一方 人 一 纪 )2 十 (一 二 十 各) 人 一 二 ) 一 方 生 十 名 十 名 
代入 zir) 一 ztr) 一 0, 求 得 
= 译 [ 二 如一 V6 一 可 一 88 一 全 ] 


/一 3[ist e 十 VB ot de 


对 于 本 例 ,t/= 一 8,6 二 4, 二 2, 故 有 
上 一 .764， it,=7.236 


于 是 ,e- 燃 料 最 优 控制 为 


0， 当 2.764 志 1 过 7. 236 
十 1， 当 7.236 志 1 志 8 
由 力作 ) 王 十 1, (2) 一 一 1, 解 得 
A1(0)=2.236， (0) 一 0. 447 


一 1， 当 0 二 :过 2.764 
u(t) 一 


于 是 
At) 一 2， 236(1 一 0. 21)， 4 (zt) 一 (0， 447 


将 记 代入 zt)= 一 上 十 名 , 求 得 


二 = [zi (£1) | 一 0.7014 


于 是 ,由 命题 3-6 可 求 出 -最 小 燃 耗 
六 一 | 十 se 一 3.528 
事实 上 ,将 wu* 2) 代入 J 的 表达 式 , 可 得 相同 结果 。 


习 是 


3-1 已 知 一 阶 系 统 状 态 方程 为 
Z(t)=u(t), xX(0)=1 


试 求 使 下 列 性 能 指标 : 
J =| efz (2) u(t) ld 


为 极 小 值 的 最 优 控制 a* () 和 最 优 轨 线 x* (2)，。 
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(3-290) 


(3-291) 


3-2 设 二 阶 系 统 的 状态 方程 
TZ1(t) = x (t) 
Tai 一 Tt 十 Mt) 
边界 条 件 
XiC0) 一 1， ZooCO0) 一 1] 
XT1(2)=0, x,(2)=0 
试 求 下 列 性 能 指标 的 极 小 值 . 
J=3| [zr (0) +ule) de 


3-3 设 一 阶 系统 方程 
x(t)=wu (lt), X(0)=1,， x(tr)=0 


试 求 最 优 控制 xw* (4) ,使 性 能 指标 
7 一 22/ 十 却 | (Dd 


极 小 。 设 ty 目 由 。 
3-4 给 定 一 阶 系统 方程 
zt 一 一 (1 十 xi， x0)=1 
控制 约束 为 jx | 委 1，, 试 求 使 下 列 性 能 指标 : 


7=| [x00)—3uC) la 


为 极 小 值 的 最 优 控 制 z* (2) 及 相应 的 最 优 轨 线 z* (2)。 
3-5 已 知 二 阶 系统 的 状态 方程 
Z(t)=u(t), ZX1(0)=0, zi1(1)=1 
Zz (=zT(t ut), X20)=0, zz(1) 一 ] 
试 求 最 优 控 制 wr? (2) 和 wz (2) 以 及 最 优 轨 线 x? (和 zz (2) ,使 性 能 指标 


] 
J 一 | Lat) tu + J 


为 极 小 值 。 
3-6 已 知 二 阶 系统 方程 
it 一 Tai X11(0)=0, ZiCtr) 一 2 
T(t)=ult), X22(0)=0, Ta 人 tr) 一 2 
式 中 |uQ)| 志 1,ty 自由 。 试 求 使 性 能 指标 


J= 访 | [zf + (2) 4 (2) 1dz 


为 极 小 的 最 优 控制 a* (2)、 最 优 轨 线 x* (2) 以 及 最 优 指标 了。 
3-7 已 知 二 阶 系统 


万 (DD 一 zz 和) 十 地 Tz1(0) 一 一 地 


tut) =ult), zal0)= 一 地 


式 中 控制 约束 为 
lu (lt) < 


试 确定 最 优 控制 x" (4) ,将 系统 在 tj 时刻 由 x00) 转 移 到 状态 空间 原点 ,并 使 性 能 指标 
J=| /ued 


取 最 小 值 ,其 中 zj 自由。 
3-8 设 一 阶 系统 
区 (1 一 zt) 一 tt， zx(0)=2 
控制 约束 为 jz)| 委 1, 试 确定 最 优 控制 x (使 性 能 指标 


J=| [2zGo) —ult) jd 


为 极 小 值 。 
3-9 设 系 统 状态 方程 
TI1(t)=z(t), X11(0)=0 
TZ2(t)=— zt)tult), rz,(0)=0 
性 能 指标 
J 二 启 [z1C2) 一 5 十 去 [z262) 一 2 了 十 二 | Ca)de 
4 2 2 Jo 
末 痊 约束 条 件 
X1(2) 十 5X2(2) 二 15 
试 求 使 / 极 小 的 最 优 控 制 w* (2)。 
` 3-10 设 一 阶 系 统 
zt)=u(t), 7z(0)=1, x(4)=1 
控制 约束 ;|u(z) | 三 1, 试 求 使 性 能 指标 


1 
7= 志 | 2 人 tydi 
2 |， 


为 最 小 的 最 优 控制 x" () 和 最 优 轨 线 z”(t)。 
3-11 已 知 系 统 状态 方程 
Tt 一 .To Zz1(0)=0 
Tott)=-Tat)， Zz.(0)=0 
Zs3(t)—=u(t), Xz3(0)=0 
试 与 出 在 控制 约束 |u(z)| 志 1 条 件 下 ,使 系统 由 已 知 初 态 转移 到 目标 集 
TiCtr) 一 弛 
Za 人 tr) 一 人 3 人 (tr 
且 使 性 能 指标 
J =z (tn) + | cd 


为 最 小 的 必要 和 条件, 其 中 ty 目 由 。 
3-12 设 系统 状态 方程 .初始 条 件 及 控制 约束 与 题 3-11 相同 , 试 写 出 使 系统 由 初 态 


”124， 


转移 到 目标 集 
zi(1) 十 zz2(01) 一 ] 


上 且 使 性 能 指标 
7= 于 | wldt 


为 最 小 的 必要 条 件 。 
3-13 已 知 非 线性 系统 
z(t)=—7x (u(t), ZCO) 一 1 


试 确 定 最 优 控 制 x* (4) 和 最 优 轨 线 z (使 下 列 性 能 指标 极 小 ， 
J 一 去 | [z+w lt) dt 
3-14 已 知 一 阶 系统 
z(t)=—z0) tud) 
试 求 最 优 控 制 &” (1) 和 最 优 轨 线 x" (1) ,使 系统 由 x(0)= 二 10 转移 到 z(1) 王 0, 且 使 下 列 性 
能 指标 极 小 : 
J= 记 | (di 
3-15 设 系 统 方程 为 
Zi(t)=z(t), x1(0)=10 
Zlt)=ult), zx.(0)=0 
试 求 最 优 控 制 zx" (1) 和 最 优 轨 线 x* (1), 使 下 列 性 能 指标 极 小 : 
J=#+ 访 | wdi 
式 中 希望 的 末端 状态 分 别 为 
Q) zi(t/)=zx,(ty)=0, 
加 riG/)=0,zz(t/) 自 由 。 
3-16 已 知 系 统 方程 
Zt)=w (tut), rx(0)=1 
试 求 最 优 控制 wr (2) 和 wi (2) ,使 性 能 指标 


J 斑 | [zx (ti) 十 zt 十 zt) dt 


取 极 小 值 。 
3-17 已 知 系统 方程 
: Z(t)=7zT(t), rx1(0)=1 
tt)=u(t), xXx.(0)=0 
性 能 指标 / 


1 | 
J 一 去 | 2 Cd 
0 


末端 要 求 
TI) 一 Zz(1) 一 0 
,125 。 


试用 连续 极 小 值 原理 求 最 优 控制 x* (6 与 最 优 轨 线 x* (2)，。 
3-18 已 知 与 题 3-17 等 价 的 离散 系统 
Xi(k 二 1) 二 x(k) 十 0.1zx(k)， XxX1(0)=1 
Xs(k 二 1)=z,(k)0. lu(k), x,(0)=0 


性 能 指标 
J 一 0.05 十 > ju’(k) 


末端 要 求 
zx1(10)—= xz.(10)=0 
试用 离散 极 小 值 原理 求 最 优 控 制 w"(%) 和 最 优 轨 线 x (4%), 并 与 题 3-17 两 点 边 值 问题 的 
离散 化 结果 进行 比较 。 
3-19 设 一 阶 离散 系统 
Tk+1)=r(k)+u(k), rz0)=1 
性 能 指标 加 
JJ 一 > ,zr (Ek)+u (8)] 


上 


试用 离散 极 小 值 原理 求 最 优 控 制 序列 w* (8k) ,k= 二 0,1,2,3, 以 及 最 优 指标 ./ 。 
”3-20 设 线性 离散 系统 的 状态 方程 
X(RE 十 1) 一 4(ED)X(R) 十 加 (有 DER) 
xX(0)=xo 
k=0,1,.…,N—1 
式 中 x(4) EE R",w(k) ER”"。 性 能 指标 


入 一 1 
J=3x NFON)KCN) + DExT Ck)QR CR) FuT Ck ROME) 
“4=0 


式 中 对 称 和 矩阵 序列 FCN) 宇 0,0(k) 之 0,R(k)>0。 试 用 离散 极 小 值 原理 证 明 :最 优 控制 序 

列 

pz (k)——R RB RA TRLPOE) —OC() jxCk) 
k=0,1,.…,N—1 

式 中 P(k) 满 足下 列 Riccati 差分 方程 及 边界 条 件 ， 
P(A) 一 CQ(CE) 十 4 RI LP Ck) HBOEIR™ EBT EE) -1ACE) 
PIN)=F(N) 

3-21 设 二 阶 离散 系统 


0 ] 0 1 
zw+D=| roD+| | ep， x(0)=| | 
—] 1 1 ] 
未 病状 态 ZX1(3) 目 由 ,xs(3) 二 0。 性 能 指标 
2 
J= > [rik+1)+u: Ck)] 
k=0 


试 求 最 优 控制 序列 w* (0) ww* (1) wu (2)。 
3-22 设 离散 状态 方程 及 量 测 方程 为 
* 126，。 


ZX(k1)=0.57r(k)0. 3u(k) 

y(k)=3r(k)—wu(k) 
x(1) 给 定 ,要 求 0<<u(k) 志 x(%)。 问 如 何 选 择 w(1)、u(2)、u(3) 和 w(4), 使 得 下 式 的 值 为 最 
小 ; 

J 一 y(1) 十 y(2) 十 y(3) 十 y(4) 
3-23 设 离散 系统 的 状态 方程 为 
Tk+1)=1.3r(k)—0.3u(k), GO) 一 5 

试 求 最 优 控制 序列 wx” (%), 使 性 能 指标 


3 
J=4 Lr +ulk)] 


为 最 小 值 。 设 控制 约束 为 


F<u(h)<I 


3-24 已 知 离散 系统 方程 
XT(kT1)=zr Rk) tar (Fk) pulg) 


边界 条 件 
TX(0)= zo, X(N)=0 
性 能 指标 
J=B Leh) tu Ck)] 
试 确定 最 优 解 的 必要 条 件 。 


3-2$ 设 离 散 系 统 状 态 方程 
xCk+1)= Fx CE) uk),k|, x(0)=x,o 


性 能 指标 


J= >/ZLLz(R 二 1) x(k) CR 十 1) ,uk) ,k] 
目标 集约 束 
pLxCN),N]=0 
试用 离散 极 小 值 原理 分 别 推导 当 N 自由 和 N 固定 时 ,最 优 解 的 必要 条 件 。 
3-26 ”在 题 3-25 中 ,如 果 离 散 系 统 状 态 方程 为 
(D xCk1)= Ff x(k) CR 十 1) ,|, 
(© x(k+1)=x Ck) fx CR) uk) ,Ek | 
试 重新 推导 其 最 优 解 的 必要 条 件 。 
3-27 设 二 阶 系统 方程 


0 ] 0 
xD 一 | w+ ju 
—1 一 ] 


XCO0) 一 X0 
式 中 控制 约束 为 |u(iz) | 二 1。 试 确定 将 系统 由 已 知 初 态 最 快 地 转移 到 x(zy) 二 0 的 最 优 控制 
员 数 x* (1)。 
3-28 已 知 系统 的 状态 方程 
*° 1]27* 


XI1(t) = zx, (t) 
X(t) =—=u(t) 
控制 约束 为 |u(i) | 三 1。 试 求 最 优 控 制 a* (2) ,使 系统 由 任意 初 态 最 快 地 转移 到 z(ty)= 二 2， 
zz(t/) 二 1 的 末 态 。 写 出 开关 曲线 方程 ,并 绘 出 开关 曲线 的 图 形 。 
3-29 设 二 阶 系 统 方程 


#0)=| 一 = 二 | let) 
控制 约束 |uQ)| 志 1. 试 求 使 系统 由 任意 初 态 最 快 地 转移 到 坐标 原点 的 最 优 控制 uw* (2) ,并 
写 出 开关 曲线 方程 。 
3-30 给 定 二 阶 系统 
Xi(lt)=Zxs(t), 7x1(0)=]1 
tt)= 47 —27r0)TuG), zx,0)=1 
控制 约束 一 1 委 x(5 委 十 1。 试 确定 使 系统 由 已 知 初 态 最 快 地 转移 到 坐标 原点 的 最 优 控制 
wu (1), 
3-31 设 二 阶 系 统 
ft 一 To)， x1(0)=1 
za(t) 一 一 Tao) 十 zt ， x:(0)=1 
控制 约束 |u(z) | 三 1。 试 求 使 系统 由 已 知 初 态 最 快 地 转移 到 坐标 原点 的 时 间 最 优 控 制 
uw” (t) 和 开关 曲线 。 
3-32 已 知 系 统 的 状态 方程 
ZX1(f)=— zt) —u() 
z(t) = — 27,() — 2u() 
控制 约束 |ulz) | 三 1。 试 求 将 系统 由 任意 初 态 (&1,&,) 转 移 到 坐标 原点 的 时 间 最 优 控 制 律 
2 (zt) 。 
3-33 已 知 二 次 积分 模型 
Z1(t) = x (t) 
z(t) =wu (lt) 
目标 集约 束 
S={(zi,7T2) |z1 二 zi=1)} 
试 求 由 目标 集 外 的 任意 初 态 (&1 ,6,) 转 移 到 目标 集 的 时 间 最 优 控 制 律 x* (z) 。 
3-34 若 题 3-33 的 目标 集 改 为 
S={(zi,T2) |z1 = 7x2, |z| 魏 ]) 
试 求 时 间 最 优 控制 u" (2)。 
3-35 已 知 系统 方程 


一 ! 2 0 
CD 一 | e+| | X(to) = xo 
0 一 1] 了 


控制 约束 |xG)| 委 1。 试 确定 使 系统 由 已 知 初 态 以 最 短 时 间 转 移 到 坐标 原点 的 开关 曲线 ， 
3-36 已 知 系 统 方程 z 


GO 一 | | +), | (1) 
-> 3) 2 
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y(to) = yo 
控制 约束 |u()| 志 1。 试 确定 使 系统 由 已 知 初 态 以 最 短 时 间 转 移 到 坐标 原点 的 开关 曲线 。 
3-37 证 明 通 过 下 列 线性 变换 : 


] 0 
: yD)=| ,| 
可 由 题 3-36 得 到 题 3-35。 试 问 :这 种 线性 变换 是 否 影响 上 述 两 个 问题 的 开关 上 曲线? 
3-38 已 知 系统 方程 
Z1(t) = Zz, (t) 
ZX2(t) = x(t) 
Ta3(t) 一 ME) 
控制 约束 |x (bj| 委 1。 试 确定 使 系统 由 已 知 初 态 x(to)=xo 最 快 转移 到 坐标 原点 的 开关 曲 
面 。 
3-39 议 二 阶 线性 离散 系统 方程 为 
了 
X(R 十 1) 一 3 | orb 
一 1 一 1] | 


oo- 
控制 (4) 不 受 约束 。 若 要 求 系统 在 一 个 采样 周期 内 到 达 状态 空间 原点 , 试 确定 初始 状态 


应 满足 的 约束 条 件 , 并 求 相 应 的 最 优 控制 zx“(0)。 
3-40 已 知 二 阶 离散 系统 


] 1l—e” e | 
xGtTD 一 | [c+| ug) 
0 e-! ]—e-! 


要 求 系统 在 一 个 采样 周期 内 ,由 初 态 x(0) 转 移 到 原点 。 试 求 最 优 控 制 w* (0)。 
3-41 已 知 系统 方程 
Ti1(t) = z(t) 
L(t) =—=u (lt) 
控制 约束 |ulz)| 夺 1。 起 始 时 刻 t。 和 末端 时 刻 tj 为 已 知 值 。 初 态 名 =1,6 一 1; 未 态 要 求 
zt 一 Zr) 一 0。 试 确定 以 切换 时 间 表 示 的 e- 人 燃料 最 优 控制 律 na* (5 ,使 性 能 指标 
J=| ‘lu lat 
为 最 小 ,并 求 e- 最 小 燃 耗 J 。 
3-42 已 知 系统 方程 
Z(t)=ult), x1(0)=2, zi1(8)=0 
Xs(t)—=x(t), zx2(0)=2, zz(8) 一 0 
控制 约束 |u(z) 委 1。 试 求 以 切换 时 间 表 示 的 时 间 - 梁 料 最 优 控制 (z) ,使 性 能 指标 


J= | (1+ luG) 1)dt 
取 极 小 值 ,并 求 最 优 指 标 了"*。 
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第 4 章 动态 规划 


在 现代 社会 ,由 于 经 济 以 及 自然 科学 的 发 展 ,自然 地 产生 了 根据 被 控制 过 程 的 有 限 信 
息 作出 高 水 平 决 策 的 需求 。 由 于 被 控制 过 程 具有 不 确定 性 ,因此 决策 方法 必须 保持 灵活 
性 ,并 具有 适应 瞬时 变化 的 能 力 。 

20 世纪 50 年 代 , 美 国学 者 R. 贝尔 曼 系 统 和 精确 地 研究 了 这 种 决策 方法 ,提出 了 以 
所 研究 过 程 现 有 状态 为 依据 的 动态 规划 方法 .时 至 今日 ,由 寺 计 算 技术 和 计算 方法 的 迅速 
发 展 ,动态 规划 在 生产 收益 ,资源 分 配 . 设 备 更 新 .优化 设计 .信息 处 理 和 模式 识别 等 领域 
中 获得 了 广泛 的 应 用 。 本 章 主要 介绍 动态 规划 在 控制 工程 和 控制 理论 中 解决 动态 系统 最 
优 控制 方面 的 应 用 。 

动态 规划 ,从 本 质 上 讲 是 一 种 非 线性 规划 方法 ， 其 核心 是 贝尔 曼 最 优 性 原理 ， 这 个 原 
理 可 归结 为 一 个 基本 递 推 关 系 式 ,从 而 使 决策 过 程 连续 地 转移 ,并 将 一 个 多 步 最 优 控制 问 
题 化 为 多 个 一 步 最 优 控制 问题 ,从 而 简化 求解 过 程 。 利 用 动态 规划 求解 控制 有 约束 (或 控 
制 及 状态 均 有 约束 ) 的 离散 最 优 控制 问题 特别 方便 ,但 也 受到 问题 维 数 的 限制 ,应 用 有 一 
定 的 局 限 性 .动态 规划 在 控制 理论 上 的 重要 性 表现 为 :对 于 离散 控制 系统 可 用 以 得 到 某 些 
理论 结果 ,从 而 建立 起 迭代 计算 程序 ;对 于 连续 控制 系统 ,除了 可 以 得 到 某 些 新 的 理论 结 
果 外 ,还 可 建立 起 与 变 分 法 和 极 小 值 原理 的 联系 。 


4.1 多 级 决策 问题 


动态 规划 是 求解 多 级 决策 过 程 最 优化 的 一 种 数学 方法 .所 谓 多 级 决策 过 程 , 是 指 把 一 
个 过 程 分 成 者 干 阶段 ,每 一 阶段 都 作出 决策 ,以 使 整个 过 程 取得 最 优 效 果 。 通 过 对 多 级 决 
策 问题 的 讨论 ,可 以 初步 了 解 动态 规划 的 思想 和 方法 ,最短 路线 问题 是 多 级 决策 问题 的 一 
个 典型 例子 。 


4.1.1 最 短路 线 问 题 


设 由 4 至 下 的 路 线 如 图 4-1 所 示 。 要 求 选 择 一 条 路 程 最 短 的 线路 。 各 地 间 的 距离 已 
标注 在 图 中 。 由 4 到 B(B1,B,,B;), 需 要 选择 一 条 路 线 , 使 AB: 之 间 路 程 最 短 , 称 为 一 级 
决策 过 程 ;再 从 B(Bi,B,,B;) 到 CCCi,C;,C;) 选 择 一 条 路 线 4BC ,使 AC 之 间 路 程 最 短 ， 
称 为 二 级 决策 过 程 ;从 ABCD 选择 一 条 路 线 , 使 4D 之 间 路 程 最 短 , 称 为 三 级 决策 过 程 ; 
以 此 类 推 。 显然 ,对 于 图 4-1 路 线 , 从 4 到 FF 共有 五 级 决策 过 程 。 为 了 确定 AF 之 间 最 短 
路 线 ,可 以 采用 穷 举 法 与 动态 规划 法 两 种 方法 。 

穷 举 法 是 列 出 所 有 可 能 的 路 线 , 计 算 各 路 线 的 路 程 ， 通过 对 比 后 得 到 最 短路 线 ， 本 例 
共有 38 条 可 能 路 线 , 如 图 4-2 所 示 。 由 图 可 知 ,决定 每 条 路 线 的 长 度 需 作 4 次 加 法 , 故 共 
需 加 法 152 次 ,比较 37 次 。 最 后 得 最 短路 线 为 A4BsC1D1EsF ,最 短 距 离 .太一 14。 
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图 4-1 最 短路 线 问题 
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策 过 程 的 级 数 ;x 表示 在 任 一 级 所 处 的 位 置 , 称 为 状态 变量 ;Sw(x) 为 决策 变量 ,表示 当 状 
态 x 以 后 还 有 NN 级 时 ,所 选取 的 下 一 点 ;Jn(x) 表 示 由 状态 x 到 终点 下 的 NN 级 过 程 的 最 
短 距 离 ;d(x,Sw) 表 示 Xx 点 到 Sw 的 距离 。 对 于 图 4-1 问题 ,从 最 后 一 级 开始 计算 。 
(1) N= 二 5(E 级 ) z : 
TE1)=1 
J (Es)=2 
将 E(k1,E;) 至 FF 的 距离 数字 标注 于 图 4-3 中 ,数字 旁 插 号 内 的 文字 表示 相应 的 决策 变 
量 。 由 于 从 El 到 FF 以 及 从 EE;, 到 FF 都 只 有 一 种 可 能 ,所 以 本 级 无 决策 问题 。 
(2) N==4(D 级 ) 
本 级 决策 有 三 种 选择 。 每 种 选择 中 又 有 两 条 可 能 的 路 线 。 例 如 ,从 出 发 ,可 达 Ei， 
也 可 达 五 ,, 所 以 
dDIyEDTIED) 14 十 1 
dD. ymin (|= 
说 明 D, 至 下 的 最 短 距离 为 4, 路 线 为 DJE,F ,决策 变量 为 
S,(Di)=E, 


1D =min| 


同 理 , 从 D; 出 发 时 ,有 


(oD ee [6 十 1 
J ,CD,) 一 =— min -一 | |= 
a (DD,,E,)+J (EE,) 9 十 2 
说 明 D; 至 下 的 最 短 距离 为 7, 路 线 为 D,E1F ,决策 变量 为 
. SD,)=E, 
从 Ds 出 发 时 ,有 
C (7 ,下 J(E) 
1cpy =min| 1) ,= in (= 
d (Ds,E,) tJ (EE,) 5 十 2 


说 明 D; 至 的 最 短 距 离 为 7, 路 线 为 D;EsF ,决策 变量 为 
SD )=E, 


将 (E,) 标 注 于 图 4-3 中 的 Di 点 处 ,DCE,) 标 注 于 D; 点 处 ， "2 标注 于 Ds 点 处 。 
(3) N=3(C 级 ) 


HO) © (D) 图 (5 
0 | 
人 na 
YN 8 2 < 1 
一 


义 六 3 


2 
De 2 


图 4-3 决策 过 程 
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本 级 有 三 种 选择 ,计算 过 程 如 下 : 


~ {dCi,Di) +J(D)) [1 十 4 
Co-aa so py) 0) | 
决策 变量 
Si (Cn ) 一 万 ， 
2 Co DT) 十 (DDN ) 8 十 4 
pe 
d(C, , D;) + .JD;) 6 十 7 
决策 变量 : 
Si3(C;)= DD, 
d (Cs,D)+J CD) 4 十 4 
Nd-miolaC DI HTD inl tt 
d (Cs,D;3) + J, CD;,) 2 十 7 
决策 变量 z 
Ss3(C3) = DI 
在 图 4-3 中 的 标注 情况 与 N= 二 2 时 类 同 。 
(4) N 二 2(B 级 ) 
本 级 决策 有 三 种 选择 ,计算 过 程 如 下 : 
ng rc) | 国生 | 
(Bi)=min 一 min 一 14 
d (B,C2) TJ;(C,) 5 十 11 
决策 变量 
Ss (Bi1)=O 
d(B, ,C1)++J (C1) 4 十 5 
re 
d (B, ,Cs)+t+J:(C;,) 5 十 8 | 
决策 变量 
S41(B,)=CO) 
ne Co 1 
J,(B,) = min 一 mnl 一 12 
dB;,C3) J (C3) 7 十 8 
决策 变量 
S44.(B,)=C, 


将 上 述 计 算 结 果 相 应 标注 在 图 4-3 中 。 
(5) N 一 1(4 级 ) 
本 级 决策 是 唯一 的 ,计算 结果 为 
d(A,B,)+J (Bl) 3 十 14 
ER eT -+ 
d(A,B;)+J,(B;) 4 十 12 
决策 变量 
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Ss;(A)=B, 
将 决策 结果 四 (Bs) 标 在 图 4-3 中 的 4 点。 
最 后 ,在 图 4-3 中 可 顺序 确定 最 短路 线 为 4B,C1D1E2F ,最 短 距 离 J "二 J(A)=14，。 
这 一 结果 与 穷 举 法 所 得 结果 完全 一 致 ,但 只 用 加 法 24 次 ,比较 14 次 ,计算 量 比 穷 举 法 大 为 减 
>。 级 数 N 越 大 ,每 级 的 状态 变量 越 多 , 则 动态 规划 计算 量 比 穷 举 法 计算 量 减少 越 多 。 


少 


对 于 本 例 ,求解 时 采用 的 递 推 方程 的 一 般 形 式 为 
Tn (x)=mintdlx,Sw(x) + Jw-iLSn(x))) (4-1) 
以 及 
T(x)=al(r,F) (4-2) 


在 动态 规划 中 ，, 式 (4-1) 和 式 (4-2) 称 为 函数 方程 。 当 选择 第 一 个 决策 Sw(x) 时 ,其 结果 不 
但 影响 第 一 级 的 距离 dcLx,Sw(Cxz)], 而 且 影响 后 面 W 一 1 级 的 初始 状态 ,因而 也 影响 后 面 
NN 一 1 级 的 最 短 距离 。 因 此 ,最 优 策略 (各 阶段 的 决策 组 成 的 最 佳 集合 ) 的 选择 应 在 递 推 过 
程 结束 后 进行 ,不 能 在 各 级 分 散 确定 。 z 

由 本 例 的 分 析 过 程 可 知 , 一 个 NN 级 最 优 过 程 (如 从 A 至 下 的 J;(A)), 不 论 第 一 级 决 
策 如 何 ( 如 SsC4)==B,B,,B;) ,其余 N 一 1 级 决策 过 程 ( 如 从 B 至 下 ) ,至 少 必须 依据 第 一 
级 决策 所 形成 的 状态 (如 Bi,B;,B;) 组 成 一 个 N 一 1 级 最 优 过 程 ( 如 J (Bi1)、J,(B,)、J， 
(B;))。 在 此 基础 上 选择 第 一 级 决策 (如 选择 S;C4)=B,), 必 可 使 总 的 入 级 过 程 最 优 ( 如 
求 出 4)=14)。 在 多 级 决策 问题 中 ,这 种 递 推 思想 的 核心 ,是 贝尔 曼 提 出 的 最 优 性 原 
理 。 


4.1.2 最 优 性 原理 


贝尔 曼 指 出 ,多 级 决策 过 程 的 最 优 策略 具有 这 样 的 性 质 : 不 论 初始 状态 和 初始 决策 如 
何 , 当 把 其 中 的 任何 一 级 和 状态 再 作为 初始 级 和 初始 状态 时 ,其余 的 决策 对 此 必定 也 是 一 
个 最 优 策略 。 
具体 说 ,车 有 一 个 初 态 为 x(0) 的 NN 级 决策 过 程 ,其 最 优 策略 为 {wu (0) ,uC(1),… ,uCN 
一 1)}。 奢 么 ,对 于 以 x(1) 为 初 态 的 入 一 1 级 决策 过 程 来 说 ,决策 集合 f(D) wu(2),… uCN 
一 1)} 必 定 是 最 优 策略 。 
证 明 设 策 略 或 决策 序列 
8 一 (人 (0) 2 (1), ,Wu (ON 一 1)) 
是 使 代价 函数 7 了 最 小 的 最 优 策略 ,相应 的 最 小 代价 为 
J"*[xC0) |=J[x(0) ,wu’ ] 
=J[Lx(0) ,nu (0),u* (1), ,wu* (N—1))] 
= min OLLx Ck) CA) ,k] 
反 设 在 =r sr 十 1,…,N 一 1 区 间 内 ,wu* (4) 不 是 最 优 决 策 序 列 , 则 必 存 在 另 一 决策 序 
列 w(k),k 二 rr 十 1 ,… ,NN 一 1 ,使 得 
Sx Cr) ur) ut1) ,ee uN—1)] <Ix (rr) ae (r) yu’ (r 二 1) Wu* (NO—1))] 
因而 ,有 两 个 决策 序列 
Z (k), k=0,],..…,N—] 
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人 RE|0,r 一 1) 
i kEfr,N—1] 


J >>J 


太一 .JILxCO) (0 su (1), wu" CN—1)| 
=L[xCO0) ,wu (0),0] 二 … 二 LixCG—1) uu’ (1),r—1)| 
二 Lx wu Cr t+ LxCN—1),u (Nm1),N—1| 
J™* =J[xCO0) ECO0) su’ Cr 一 1)58Cr) urt+1) ,uN—1)) 
==L[xC0),wu (00),01 二 … 十 Lx 1) wu (1),r—1| 
二 LExCr) ,wcr) ,rj 十 … 十 L[xCN—1) ,uC(N—1),N—1] 
上 述 结果 与 7' 为 最 小 代价 的 假设 相 矛 盾 。 因 此 , 反 设 不 成 立 , 最 优 性 原理 得 证 。 
对 于 连续 系统 ,最 优 人 性 原理 可 以 表述 为 : 若 对 于 初始 时 刻 如 和 初始 状态 x (0) ,wu* (2) 
和 x" (1) 是 所 论 系 统 的 最 优 控 制 和 最 优 轨 线 , 则 对 于 时 刻 (4 二 to) 和 相应 状态 x (zi) 来 
说 ,GotE Lo 和 xzE [tr 仍 是 所 论 系统 往 后 的 最 优 控制 和 最 优 轨 线 。 
上 述 结论 同样 可 用 反 证 法 证 明 : 反 设 从 x(t1) 到 x(z/) 还 有 另 一 条 路 线 为 最 优 , 则 原来 
从 x(to) 到 xGtr) 的 轨 线 显然 不 是 最 优 , 从 而 与 原来 的 假设 矛盾 。 因 此 , 反 设 不 成 立 。 连 续 系 
统 的 最 优 性 原理 成 立 。 
最 优 性 原理 为 解决 多 级 决策 过 程 的 寻 优 问题 提供 了 简便 而 有 效 的 方法 ,可 将 一 个 多 
级 最 优 决策 问题 化 为 多 个 单 级 最 优 决策 问题 ,并 为 导出 递 推 方程 提供 了 理论 基础 。 


4.1.3 动态 规划 的 基本 递 推 方程 


问题 4-1 设 NN 级 过 程 的 动态 方程 为 
xCk1)= flix) uk),k|, x0)=xro (4-3) 
式 中 状态 约束 x(%)EXCR" ,控制 (决策 ) 约 束 w(k)EQCR",k 一 0,1,…,N 一 1。 求 容许 控 
制 (决策 ) 序 列 & (%) ,k= 二 0,1,…,N 一 1, 使 代价 函数 (或 性 能 指标 ) 


一 


J[LxC0)]= >, 工 [xz(CE) eeCR) (4-4) 


k=0 


为 最 小 。 

在 问题 4-1 中 ,表示 级 决策 过 程 中 的 阶段 变量 ,x () 表 未 十 1 级 的 初始 状态 ， 
ul(k) 表 示 第 十 1 级 所 采用 的 控制 (决策 ) 向 量 , 如 图 4-4 所 示 。 为 了 强调 J 是 控制 & 的 泛 
隧 , 因 此 式 (4-4) 可 表示 为 


MN—1 
Jix(0),u|= DO 工 [x(E) ,uk),k) (4-5) 
天 一 站 


u(0) ul1) u(k) MN-1) 
| [2 : Ey go J* 
2 全 策 六 k+l1 曙 电击 N 
x(kK+1) 


图 4-4 NN 级 决策 过 程 
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一 般 情况 下 , 始 于 任意 状态 x(E) 的 代价 可 记 为 7JLx(E) ,wj。 其 中 
uU= {uC(k) CR 二 1) CN 一 1)) 
J[Lx(k) ,uj 表示 由 任意 状态 x(%) 到 过 程 终 点 为 止 , 由 任意 策略 w 所 导致 的 代价 。 因 此 , 始 
目 x(%) 的 最 优 代 价 为 
J * {xk) |=J[x(k),u” | 

式 中 "表示 最 优 策略 。 对 于 给 定 问 题 , 当 x(%) 固 定时 ,u’ 是 确定 的 ,因此 最 优 代价 
六 [xD)] 仅 是 初始 状态 xD) 的 函数 , 常 记 为 .JIx(R) |]。 

为 了 求 出 问题 4-1 的 最 小 代价 7 [x(o) ,0], 根 据 动态 规划 的 解 题 思想 ,把 始 自 *(0) 
的 待 求 问题 , 通 人 到 求 . 广 Lx(Ge) ,kj 的 问题 之 中 ,其 中 ,将 J *[x(0)] 写 为 J*[x(0),0] 和 将 
7" [x(k)j 写 为 J "Lx(%k) ,kj 是 为 了 强调 J 对 初始 时 刻 的 依赖 。 研 究 如 下 问题 


和 一】 
min[Lx(&) ,k= 2 LLxC) ,ul)) 让 (4-6) 
式 中 x(4) 固 定 。 状 态 方程 约束 为 
x(i+1)= flx()), uj),7 |], 71 一 R,R 十 1]，…， 入 一 ] (4-7) 
式 中 
xX(k)EXCR’ 
k=0,1,.…,N—1 
ul(k)E QCR” 
始 目 第 & 级 任 一 容许 状态 x(&) 的 最 小 代价 
J "* [x(k) ,k= min (Br) 0 


(ut) m1) Nl1)}EN 


= min (LLxCk) ,uCk) ,E+ bp [CD CD 让) (4-8) 


WR) (十 I) uN—1)}EN 


式 中 第 一 部 分 是 第 级 内 所 付出 的 代价 ,第 二 部 分 是 从 第 十 1 级 到 第 N 级 的 代价 和 将 
式 (4-8) 中 求 最 小 的 运算 也 分 解 为 两 部 分 :在 本 级 决策 wu(k) 下 求 最 小 ,以 及 在 剩余 决策 序 
列 {a(& 十 1) ,wk 十 2),… ,uN 一 1)}) 下 求 最 小 。 于 是 , 式 (4-8) 可 写 为 

J* [xC(k),k]|= min min {LLx Ck) ,uk) ,大 


uk)EN {uctkt+1)," HCN— 1)) 
入 一 了 

十 >) LLxC7) ,uC7) ,7)]) (4-9) 
j= 二 此 十 1 


式 中 大 括号 内 的 第 一 项 仅 取 决 于 ww(k) ,而 与 uC()),j= 二 十 1,k 十 2，,…,N 一 1 无 关 , 因 此 对 
u(7) 取 极 小 没有 意义 。 大 括号 内 的 第 二 项 , 当 x(% 十 1) 固 定时 ,其 值 取 决 于 wu0),j 二 十 1， 
十 2,…,N 一 1, 而 写 u(%) 没 有 直接 关系 ,但 是 u(%) 通 过 状态 方程 (4-7) 决 定 x (十 1) ,从 
而 影响 该 项 的 值 。 于 是 , 式 (4-9) 可 写 为 

T° [x(k),k]= min {ZLx(k) ,ulk), k | 


5 LLxC7) CD ,1 (4-10) 


根据 最 优 性 原理 和 状态 方程 (4-3) ,如 下 关系 式 成 立 ， 


min 
(atl) uN 1)}lEnN 


N—1 


= min > LEx()) su()) ,ji (4-11) 
j= 十 1 


人 (十 EN 一 TD EN .< 
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将 式 (4-11) 代 人 人 式 (4-10) ,得 动态 规划 基本 递 推 方程 
J*[x(k),k|= min {LLx(k) UR) RIT" xk 二 1) 有 十 1 


(k=0,1,.,N—1) (4-12) 


J’*|x(k),k|= min {LLx(%) WR) RI flOxCk) ,uk),k) 天 十 1 ]) 
(k=0,1,..* ,NO—1) (4-13) 
J |xCN—1),NO—1|= min {LLx CN—1) UN—1),N—1]|+J*[xCN),N | 


(4-14) 
式 中 J* [x(N),N 表示 代价 函数 J 中 的 末 值 项 。 对 于 问题 4-1 以 及 相应 的 嵌入 式 (4-6)， 
代价 藉 数 中 无 末 值 项 ,应 取 
J*[xCN),N|=0 
于 是 , 式 (4-14) 可 写 为 z 
TxCN—D,N-1]= min LLxCN— 1 uN—1),N—1] (4-15) 
式 (4-15) 仪 是 函数 LLxCN 一 1) ,uCN 一 1),N 一 1] 对 控制 uCN 一 1)ED0 的 单 级 最 优化 问 
题 ,不 再 是 式 (4-6) 那 样 的 多 级 优化 问题 ,易于 求解 。 求解 时 ,可 以 对 所 有 的 x(N 一 1)EX， 
求解 式 (4-15), 以 便 得 到 J*[xCN 一 1),N 一 1], 然 后 由 递 推 方程 (4-12) 逆 向 逐 级 递 推 , 求 
出 J [xCN 一 2),N 一 2],…,J*[Lx(1),1],J'*[x(C0),0]。 这 最 后 一 步 的 递 推 解 J * [x(0)， 
0 以 及 得 到 的 最 优 策略 {&" (0) ,uw' (1),…,u*' (N 一 1)), 正 是 问题 4-1 要 求 的 解 。 这 种 把 
怒 自 x(0) 的 待 求 问 题 检 人 到 求 始 自 x C8) 的 J ' [xC%) ,kj 问题 之 中 的 方法 , 称 为 租 套 原理 ， 
例 4-1 已 知 离散 系统 方程 
Xk 二 1)=27r(k)+u(k), rx(0)=1 


代价 函数 

J 一 z(3) 十 > /1[z2(&) 十 z2(&) 
式 中 的 状态 z(4) 及 控制 (4) 均 不 受 约束 。 试 求 最 优 控 制 序列 {zu (0) ,wu* (1),z (2)) ,使 
代价 函数 极 小 。 


解 ” 本 例 为 3 级 最 优 决 策 问题 ,可 利用 式 (4-12) 进 行 逆 向 递 推 。 
J [zx(2) |=mint [Lz (2)+u’ (2)1+ 7 [x3) 1) 


jg Lz(3)]=7z(3)=[27x(2)+u(2) 1 


所 以 
[z(2)] 一 min{z (2) 十 zz2(2) 十 [2z(2) 十 wx(2) 了 ]?) 
3{(。} 加 
5 人 一 2x(2) 十 2[2z(2)? 十 zx(2)] 一 0 
求 得 


KU (2) 一 一 2) 
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将 上 述 结果 代 人 J? [x(2)j 方 程 , 易 得 
J? [zx(2)1]= 37°(2) 


器 今 N= 二 2,k 二 1 时 
J [z=min{z*(1) t(D) + [xC2)]) 


=min{z?(1)+u (1)+3L2r(1) +u(1)T)} 
解 得 
(GD) 一 一 全 工 () 
J:[zx(1) |=4zrx(1) 


四邻 N=1,k 二 0 时 
J [zx(0) J=min {x (0) 二 ww: C0)+J7 [zc]) 


—min{zx°(0)+w (0)+4[2x(0)+u(0) J) 


解 得 
uw* (0) = 一 (0) 
J [x(0)]= 守 zx(0) 


代入 已 知 的 xz(0)=1, 按 正 向 顺序 算出 


0) 一 一 5，z GD) 一 2z(0) 上 (0 一 和， 必 [z(0)]= 公 
. 3 . 1 ，,, 
xD) 一 一 言 ，z (2) 一 2z(1) 十 xD) 一 到 J [z(1)] 一 区 
(2) 一 一 之 ， x* (3) 二 2x(2) 十 wu' (2)= 士 ， 及 [z(2)] 一 已 
5 5” 25 


于 是 ,本 例 的 最 优 控 制 , 最 优 罗 线 及 最 优 代价 分 别 为 


7" =J:[z(0)] 二 型 

由 上 例 计 算 过 程 可 见 , 用 动态 规划 解 题 要 进行 两 次 搜索 。 第 一 次 逆向 进行 , 即 用 第 & 

十 1 级 的 最 小 代价 畏 数 J “* [x (Ck 十 1),k 十 1], 根 据 基本 递 推 方 程 (4-12) 计 算 第 级 最 小 代 

价 隙 数 J*[x(%) ,kj], 第 二 次 搜索 正 向 进行 ,应 用 第 一 次 搜索 得 到 的 决策 薄 数 wu* [x* (%)]， 
根据 动态 方程 x(& 十 1) 王 ALxz(e),aCR),] 正 向 迭代 , 求 出 最 优 决 策 序列 及 最 优 轨 线 ， 


4.2 离散 动态 规划 


对 于 线性 离散 系统 , 当 控 制 变量 或 状态 变量 有 不 等 式 约束 时 ,利用 动态 规划 方法 来 求 
解 最 优 控制 问题 ,需要 采用 数值 计算 方法 。 至 于 非 线 性 离散 系统 或 非 二 次 型 代价 函数 问 
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题 , 通 常 无 法 得 到 最 优 控制 的 解析 表达 式 ,只 能 采用 动态 规划 的 基本 递 推 方程 进行 数值 计 
算 ,以 便 得 到 表格 形式 的 最 优 控制 与 最 优 代 价 函 数 。 本 节 主 要 研究 离散 最 优 控制 问题 的 动 
态 规划 解 及 其 数值 算法 ,并 指出 动态 规划 数值 算法 所 面临 的 困难 ， 


4.2.1 离散 最 优 控制 问题 的 动态 规划 解 


问题 4-2 设 非 线性 离散 系统 的 状态 方程 
x(k 二 1)= flixCk) ulR) ,Rk|, x(0)=xo (4-16) 
式 中 状态 约束 x(4)E€EXCR", 控 制约 束 u(k)EQCR”,k 一 0,1,…,N。 求 最 优 控制 序列 
uu (RE 一 0 1 N 一 1, 使 代价 函数 


极 小 。 
在 上 述 问 题 中 ,代价 函数 是 复合 型 的 , 比 问题 4-1 更 为 一 般 。 根 据 动态 规划 的 基本 递 
推 方程 , 按 如 下 步骤 求解 。 


帆 求 第 N 级 最 优 控 制 u* (CN 一 1)。 
.7 [xCN—D]= min {LLx(N— Du ND),N-1]+ [xCN) )} 
式 中 [xCN 一 1),wuCN 一 1),N 一 1] 为 本 级 代价 ;J [x (CN)]=qLxCN),N] 为 代价 函数 中 
的 末 值 项 ,或 称 终点 指标 ;x CN)= 二 f[xCN 一 1),u(N 一 1),N 一 1] 为 后 部 0 段子 过 程 初 态 。 
可 以 解 得 
u” (N—1)=u’[x(N—1)] 
以 及 
Jr LxCN—1)| 

它们 都 是 xCN 一 1) 的 函数 

@ 求 第 NN 一 1 级 最 优 控 制 u* (N 一 2)。 

J [x(N—2)]= min {LLx(N—2) ,uC(N—2),N—2J+ [xCN—1)]} 

式 中 LLx(N 一 2) ,uN 一 2),N 一 2] 为 本 级 代价 ;J? [x(N 一 1)j] 为 后 部 1 段子 过 程 的 最 小 
代价 晴 数 ,已 由 上 步 求 出 ;xCN 一 1)==f[xCN 一 2),wu(N 一 2),N 一 2] 为 后 部 1 段子 过 程 初 
态 。 本 步 求 得 w* [x(N 一 2)] 及 J?[xCN 一 2)]。 以 下 类 推 。 z 

G) 求 第 & 十 1 级 的 最 优 控 制 uw* (%)。 

TR-alx lk)]= min (LExCk) ,sulk) ,EIJIS Lx Ct1)]) 


x(k+1)—=f[xr(k) ,uC(k),k] 
得 到 ww (k) 二 ww [x(k)] 以 及 Ji8_i:[Lx(k)]。 以 下 类 推 。 
4) 求 第 2 级 最 优 控 制 u* (1)， 
Tilx(1)]= min {LExC1) ,nu(1),1]+78-2Lx C2)]) 


x(2)=f[x(1) ,uC ),1! 
式 中 J8-sLx(2)] 是 后 部 NN 一 2 段子 过 程 的 最 小 代价 函数 ,已 由 上 步 求 出 ;x(2) 为 其 相应 
的 初 态 ;L[Lx(1) ,wu(1),1] 为 本 级 代价 。 
3) 求 第 1 级 最 优 控 制 un* (0)。 
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J*[x(0) |= min {LLx(0) ,uC0) ,0 | 二 JN_iLxC1)]) 


x(1)= flx(0),u(0),0] 
求 得 w" (0) 二 uw* [Lx(0)] 以 及 JrLx(0)]。 它 们 都 是 x(0) 的 滑 数 ， 
最 后 ,由 已 知 初 态 x (C0), 顺序 求 出 w* C0),x* (Dswu* 1) CN 一 1),u’ (N 一 1) 以 
及 NN 级 过 程 最 小 代价 函数 Jxw 和 各 段子 过 程 的 最 小 代价 函数 JR_1,J8 2 ,Ji。 
例 4-2 设 离散 系统 方程 
Z(R 十 1) 一 7) 十 KR)，ZC0) 一 0，ZC4) 一 ] 
式 中 (kk)EQ=={ 一 1,0, 十 1}。 人 性 能 指标 
J = VL) Tuk)] 


求 使 性 能 指标 为 极 小 的 最 优 控制 序列 w* (&) ,二 0,1,2,3, 以 及 最 优 办 线 z* Ck) ,二 0,1， 
2,3,4., 
解 ” 本 例 末 端 固定 ,z(4) 二 1。 求解 步 骤 如 下 ， 


(1) 求 u* (3) 
因为 
ZK(4) 一 3) 十 K3) 一 1] 
TXT(3)=1]1—w(3) 
J¢[zrx(4d) |=0 
所 以 


J 一 .min {z2(3) 十 zz2(3) 十 .7 ) 


ua(3) ED 
1， 当 zx(3) 一 十 1 
= min re 当 w(3) 二 0 
zt3)E 
故 取 z 
/ 十 1 0， 当 w* 二 十 ] 
0 ]， 当 w* (3) 二 0 
(2) 求 wu" (2) 
0， 当 w* (3) 二 十 1 
1， 当 w* (3)=0 
,= min {TC(2) 二 wu (2)+J7 } 
ut2)ED 
中 取 w* (3)== 十 1 ,zx* (3) 一 0,J* 二 1 时 ,因为 
x(2)=—w(2) 


rT(3)=7x(2)+u(2) -1 


jz = min (2u (2) 十 1)} 一 4、 1， 当 w(2)==0 
HL 2 ET 
所 以 
u” 2) 一 0， xX (2)=0,， J» 一 ] 
(2) 取 zz (3)=0,xzx* 03) 一 ] 7 一 二 时 ,因为 
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XT(2)=1—wu(2) 
2， 当 zx(2) 一 十 1 
7 = min {1—2u(2)+2u 《2 十 二 一 2， 当 x(2) 一 0 
6 ， 当 z(2) 一 一 1 
所 以 
0， 当 w' (2)= 十 1 
(3) 求 wu" (1) 


fo 林 
| 
| 


XT(2)= 二 x(1) 十 w(1) 
J* = min (rz:(1)+w (1) 二 J2} 
uC(l1)EN 


QD 取 
2 (3)=1, 2 (3)=0, 凡 一 ] 
u* (2)=0, Z 2) 一 0， dj 一 ] 
可 得 
rx(1)=—u(l1) 
3， 当 &(1)== 十 1 
J 一 min (22 ora 当 w(1) 二 0 
3， 当 x() 一 一 1 
应 取 
u (1])=0, ZL) 一 0， js 一] 
已 取 
u (3)=0, zx’ (3)=]1], 一] 
UL (2)=0, Xx" (2)=1, J;=2 
可 得 
xz(1)=1—wu(]) 
3， 当 w(1)= 十 1 
J = min {1 一 2x(1) 十 20 1) 十 2} 一 43， ul)=0 
7， 当 u(1) 一 一 1 
应 取 
1， 当 w* (1)==0 
G) 取 
2 3) 一 0， Z”(3) 一 1， 一 ] 
uw (2) 一 十 1， x 2) 一 0， J; 一 2 
可 得 


xz(1)= —u(l1) 
4， 当 x(1) 一 十 1 
Js = mn {2u:(1) 二 2) 二 42， 当 x(1) 王 0 
4， 当 x(1) 王 一 


应 取 
zt (1) 一 0， TD) 一 0， Js=2 
(4) 求 xz 7” (0) 
Z(1) 一 ZC0) 十 2CO) 
= min {zx (0) Tu (0) + } 
根据 上 步 得 到 的 4 种 可 能 选择 ,分别 计算 如 下 : 
中 取 
zi (3)=1, x (3)=0, Ji= 
2 (2)=0, x 2) 一 0， vs 一] 
uu (1) 一 0，Z (1)=0, JJ 一 1] 
可 得 
Z(0) 一 一 &CO) 
3， 当 zx(0) 一 十] 
.1 -mt 当 x(0) 一 0 
3， 当 zx(0) 一 一 1 
应 取 
wu (0)=0, Z (0)=0, .5 一 1 
这 一 结果 符合 已 知 初 态 值 的 要 求 。 
G 取 
2U (3)=0, 7Z (3)=1, Ji=1 
2 (2) 一 0， 2 2) 一 1， ;= 
zw (1)=1, xz’'(1)=0, .一 3 
可 得 
xX(0)=—wu(0) 
5， 当 x(0) 一 十 1 
J -pt 当 x(0) 一 0 
5， 当 w(0) 二 一 ] 
应 取 
2 (0)=0, Z (0)=0, Ji=3 
这 一 结果 也 符合 给 定 初 态 值 要 求 。 


G@) 取 
uu 3) 一 0， Zz (3)=1, Ji=1 
zt (2)=0, x (2)=]1], J;=2 
zt (1)=0, x’* (1)=1, 7 一 3 
可 得 


ZC0) 一 一 xz(CO0) 
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4， 当 zx(0) 一 十 ] 
ji -pipe tr 当 ww(0)= 二 0 
8， 当 x(0)= 一 1 
由 于 取 x (0)=0 时 ,有 zx" (0)==1, 不 符 初 态 要 求 , 故 应 取 
u’ (0)=]1, 7 (0)=0, JJ 一 4 


也 取 
u (3)=0, 7Z 3) 一 1， .1 一 ] 
zt (2) 一 1，， 2) 一 0， J;=2 
2U (1) 一 0， ZI) 一 0， vs 一 “ 
可 得 
TX(0)=—u(0) 
4， 当 zx(0) 王 十 1 
J -pt 当 x(0) 一 0 
4， 当 zx(0) 一 一 1 
应 取 


u (0)=0, 7Z 0) 一 0， /4 一 2 
这 一 结果 也 满足 给 定 初 态 值 要 求 。 
本 步 给 出 了 满足 已 知 初 态 值 的 4 种 可 能 解 ,但 比较 后 可 以 发 现 , 只 有 第 1 种 方案 代价 
沙 数 最 小 , 故 本 例 最 优 解 为 ; 


最 优 控制 序列 : &U (k)={10,0,0,1) 
最 优 轨 线 序列 : zx" (k)= {0,0,0,0,1) 
最 优 指 标 ， Ji:=1 


本 例 表明 ;对 于 级 数 N= 二 4 的 一 阶 离散 线性 系统 ,控制 变量 约束 只 有 3 个 可 能 的 取 
值 ,状态 变量 除了 起 点 和 终点 以 外 ,没有 约束 ,利用 动态 规划 来 求解 已 有 相当 的 计算 量 。 如 
朱 是 高 阶 离散 系统 ,控制 与 状态 都 有 约束 , 则 计算 量 和 存储 量 很 大 ,需要 采用 表格 式 数值 
计算 法 。 


4.2.2 动态 规划 的 数值 计算 法 


利用 数值 计算 法 计算 离散 最 优 控制 问题 时 ,可 把 容许 控制 域 和 容许 状态 变化 范围 分 
成 若干 等 份 ; 然 后 在 不 同 容许 状态 值 x 下 ,根据 动态 规划 的 基本 递 推 方程 , 道 向 分 级 算出 
最 优 控 制 和 最 优 指标 ,并列 出 相应 的 计算 表格 ;最 后 根据 给 定 的 初 态 , 正 向 查询 各 级 计算 
表 ,确定 最 终 的 最 优 解 。 下 面 通过 具体 算 例 说 明 计 算 过 程 与 方法 。 

例 4-3 设 一 阶 非 线性 离散 系统 的 状态 方程 为 

Tk+1)=z(E) | rE) +aulE) IT, rz(0)=3 
约束 条 件 
lalR)|2, Jz)|5, VY k=0,1 
性 能 指标 


1 
J= > |z(k)—u:(k) |T 
此 一 站 
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式 中 了 二 0.1。 斌 求 使 为 极 小 的 最 优 控制 序列 {xu* (0) 271) 最 优 罗 线 序 列 {z” (0)， 
ZX"(1),zx" (2)}) 以 及 最 优 指 标 J 

解 ” 本 例 为 两 级 决策 过 程 ,分 两 步 进行 计算 ，。 

D 最 后 一 级 数值 计算 。 由于。 

J [rz(2) = zx(2) j=0 
所 以 
Jr [zx(1)]= min {|x 01)—w (1) |T) 

在 x(1) 容 许 取 值 范围 [一 5， 5] 区 间 内 , 取 11 个 数 ,间隔 为 1; 在 (1) 容 许 取 值 范围 [一 2， 
2 区 间 内 , 取 5 个 数 , 间 隅 也 是 1。 令 x(1) 为 取 值 范围 内 的 某 一 固定 值 , 遍 取 不 同 的 容许 妈 
(1) 值 ,可 以 算出 相应 的 JY [Lx(1)j; 然 后 , 列 出 z(1) 为 不 同 的 容许 固定 值 下 ,不 同 x(1) 值 
的 相应 J? [zx(1)], 从 而 得 到 本 级 的 数值 计算 表 4-1， 


表 4-1 不 同 x(1) 和 w(1) 值 对 应 的 J* [x(1)] 


十 1 十 2 
zx(1) : 


一 5 1.3 
一 4 1. 2 
一 3 1.1 
一 2 1.0 
一 1 0. 9 
0 0. 8 
十 1 0.7 
二 0.6 
43 0.5 
十 4 0. 4 
十 5 0. 3 


由 表 4-1 可 见 , 对 于 不 同 的 x(1) 值 ， 有 不 同 的 (1) 及 其 相应 的 最 优 指 标 Ji [x 0) |], 
至 于 具体 确定 哪个 uw(0) 为 最 优 控制 , 需 得 下 步 计算 后 ,由 给 定 的 <(0) 来 确定 。 
@ 倒数 第 二 级 数值 计算 。 由 状态 方程 知 
Z(1) 一 ZC0) 十 Lz (0)+u(0) IT (4-18) 
因此 
J? | zx(0) 三 min {|r(0)—u (0) T+J? [zx() |]) 


一 min (C0) i (0) IT+IF [rzC0)+ Cx: 0)+u (0))T]) 


[ut0) | 志 2 
当 x(0) 给 定时 ,代入 上 式 , 使 J2 [x(C0)] 仅 是 w(0) 的 函数 , 现 x(0) 二 3, 故 得 
: J | zx(0) 一 min 1 {3 (OTHI? [3 二 (9 二 twx(0))T]) (4-19) 
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在 u(0) 容 许 取 值 范围 内 , 令 x(0) 为 不 同 值 , 可 由 式 (4-18) 算 出 相应 的 x(1); 然 后 根 
据 算得 的 zx(1) ,查询 表 4-1, 可 得 相应 的 xz (1 和.Lz(Cl)j 再 由 式 (4-19) 算 出 .yz [x 
(0) ;最 后 由 式 
z(2) 一 z(1) 十 [zzC1) 十 xCL)]T7 (4-20) 
算得 z* (2)。 上 述 计 算 结果 如 表 4-2 所 示 。 


表 4-2 不 同 x(0) 对 应 的 最 优 解 (z(0) 一 3) 


u(0) rx* (1) wu* (1) J? Lx))] J? [zxC0)] xX" (2) 
一 2 3. 7 1 0. 27 1. 37 5. 17 
一 1 3. 8 1 0. 28 0. 68 5. 34 

0 3. 9 1 0, 29 0. 59 5. 52 
十 1 4.0 1 0. 30 0. 50 5.70 


十 2 4,.1 1.1 0. 30 0. 80 5. 89 


在 查询 表 4-1 时 , 若 由 式 (4-18) 算 出 的 x(1) 值 在 表 中 没有 时 ,需要 进行 插值 计算 。 例 
如 ,在 x(0)==3 时 , 设 u(0)= 二 一 2, 由 式 (4-18) 算 得 x(1)= 二 3.7, 查 表 4-1, 当 rz(1)= 二 3 时 ， 
zx 1) 一 十 1 LzCl) 一 0.2, 而 当 z(1) 一 4 时 ,xz (1) 二 十 1,J? [x(《1)j] 二 0. 3, 因 此 ,插值 
算出 xz (1)= 二 十 1,J? Lz(1)]==0.27; 再 由 式 (4-19), 可 求 出 J;[x(0)]==1. 37; 最 后 由 式 
(4-20) 算 出 x" (2)==5.17。 于 是 ,产生 了 表 4-2 中 第 一 行 各 个 数据 ,其 余 各 行 数据 同样 方 
法 求 得 。 
比较 表 4-2 中 各 行 的 结果 可 知 , 本 例 的 最 优 解 为 
tz (0) ,wu (1)}={1,1} 
{tz (0) ,rz (1),z (2)}= {3,4,5.7)} 
J "=Ji[zx(0)]=0.5 
利用 动态 规划 数值 计算 法 来 求解 离散 最 优 控制 问题 ,原则 上 也 可 以 适用 于 高 阶 系统 。 
对 于 非 线性 系统 或 非 二 次 型 性 能 指标 ,特别 是 控制 变量 与 状态 变量 都 有 不 等 式 约束 条 件 
的 最 优 控制 问题 ,利用 动态 规划 来 求解 不 会 产生 什么 困难 ,只 要 系统 的 离散 模型 是 正确 
的 ,计算 最 优 解 时 就 可 以 不 必 考 虑 结果 是 否 是 局 部 极 小 值 . 但 是 ,动态 规划 的 明显 弱点 是 ; 
计算 量 和 存储 量 随 x(%) 和 wl%) 维 数 的 增加 急剧 增长 。 例 如 ,对 于 状态 向 量 为 n 维 、 控 制 向 
量 为 m 维 、 时 间 离 散 段 为 入 的 离散 系统 ,在 状态 向 量 的 每 个 元 取 请 个 值 . 控 制 向 量 的 每 
个 元 取 9 个 值 的 情况 下 ,计算 性 能 指标 的 求 值 次 数 为 Np”"g” 次, 要求 存储 容量 为 22" 个 
字 。 假定 一 次 求 值 的 计算 时 间 为 10us, 取 入 二 10,p 二 q= 二 20,n 二 3,m 二 1, 则 需要 存储 量 为 
1. 6 万 个 字 , 编 制 表格 的 时 间 约 需 16s 。 如 若 n 二 6,m= 二 2, 其 余 不 变 , 则 需要 存储 量 为 1. 28 
亿 个 字 ,计算 次 数 为 2560 亿 次 ,大 约 需 要 711 小 时 的 离线 计算 时 间 。 有 时 ,巨大 的 计算 量 
使 现代 计算 机 也 无 能 为 力 。 这 正 是 贝尔 曼 所 指出 的 :动态 规划 的 不 足 是 会 产生 “ 维 数 灾 
难 ”"。 因 此 ,动态 规划 一 般 用 来 解决 低 维 最 优化 问题 。 


4.3 连续 动态 规划 


最 优 性 原理 表明 ;对 于 给 定 的 性 能 指标 , 当 从 状态 空间 的 任 一 点 出 发 时 ,其 最 优 控制 
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仅 取决 于 被 控 系 统 在 这 一 点 的 状态 ,而 与 到 达 该 状态 以 前 的 系统 经 历 无 关 。 这 就 是 所 谓 的 
“无 后 效 性 ”, 或 者 说 性 能 指标 函数 具有 马尔 科 夫 特性 .事实 上 ,大 量 有 意义 的 工程 .经 济 和 
生物 控制 过 程 的 性 能 指标 函数 都 具有 马尔 科 夫 特性 ,甚至 一 些 不 能 用 解析 关系 来 表达 的 
性 能 指标 函数 ,也 同样 具有 马尔 科 夫 特性 。 

根据 性 能 指标 的 马尔 科 夫 特性 ,最 优 控制 可 表示 为 u* (x), 从 而 可 使 系统 实现 闭环 反 
馈 控 制 。 这 时 ,不 论 初始 条 件 如 何 ,最 优 控 制 u* (x) 均 能 将 系统 由 初始 状态 x(t) 转移 到 要 
求 的 目标 集 。 

本 节 将 讨论 如 何 用 动态 规划 方法 求解 连续 时 间 系 统 的 最 优化 问题 ,得 出 动态 规划 的 
连续 形式 一 一 哈密 顿 - 雅 可 比方 程 。 


4. 3. 1 连续 时 间 系 统 的 最 优 控 制 问 题 
问题 4-3 设 连 续 时 间 系 统 的 状态 方程 为 


X(t)= ffx) ut),t), xlto)—=xo (4-21) 
式 中 x (DER"w(t)EQCR”";f(。)ER" 且 连续 可 微 。 
目标 集约 束 
py LxC) ,tr |=0 (4-22) 
式 中 J (，)€R’,r<n。 : / 
性 能 指标 
Txosto]—gx C27) s+ | LEx G8) sult) ,tdt (4-23) 


假定 以 t 为 初始 时 刻 ,tE [zo,tjj,x(z) 为 初始 状态 时 ,函数 J[x(2) ,tj 连续 , 且 对 x() 和 it 有 
连续 的 一 阶 和 二 阶 候 导 数 。 要 求 在 容许 控制 域 Q 中 ,确定 最 优 控 制 u* (2) ,使 系统 (4-21) 
由 已 知 初 态 x。 转移 到 要 求 的 目标 集 (4-22), 且 使 性 能 指标 (4-23) 极 小 。 

为 了 求 得 上 述 控制 有 约束 的 连续 系统 的 最 优 解 , 除 可 采用 极 小 值 原理 外 ,还 可 应 用 连 
续 动 态 规划 方法 ,其 数学 基础 为 哈密 顿 - 雅 可 比方 程 。 


4. 3.2 哈密 顿 雅 可 比方 程 


为 了 使 讨论 的 问题 具有 一 般 性 ,采用 J[x(z),z] 作 为 问题 4-3 的 性 能 指标 函数 。 只 要 
确定 了 最 优 性 能 指标 J* [xQ) ,i] 及 其 相应 的 最 优 控制 wu* (zt) 和 最 优 轨 线 x* (2), 则 问题 4- 
3 的 对 应 于 t6 和 x(to) 的 最 优 解 也 就 随 之 而 定 。 

设 u[t,ty] 表 示 在 区 间 [t,ty]J 上 的 控制 函数 , 则 最 优 性 能 指标 可 表示 为 


T° [r,t]= min, (HxG7) os 十 | LExCr) ur) ,rdr) (4-24) 
[| itr 上 


将 最 优 控制 wu" () 的 选择 过 程 分 为 两 步 ; 先 选择 区 间 f[ 十 At,zy] 上 的 最 优 控 制 ;再 选择 区 
则 [t,t 十 At) 上 的 最 优 控 制 。 根 据 最 优 性 原理 , 式 (4-24) 可 写 为 


J * {x(t),t|= | LI|x(lr) ,ulr), r ldr 


min {nm [十 总 ， min ,| 
+ LEx Cr) yule) ,rldrt+ oxy) ,£7]) (4-25) 
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存 式 (4-25) 中 ,因为 | LL[x C7) yur) sr]dr 与 在 区 间 [z 十 At,tyjJ 上 的 控制 ult 十 At,tjj 无 
关 , 且 因 最 优 性 原理 指出 

J" [x(t++Ai) tA min ea， ZE UCT) ,Tdr+ x(ty) ,站 | (4-26 ) 
故 式 (4-25) 可 以 表示 为 

J" [x(z), j= min (| LEC acedr+7 [rt A ,tt A (4-27) 


十 生生 
式 (4-25) 右 端 中 的 第 一 项 ,根据 积分 中 值 定理 ,得 
| ZeGnDunoDrldr=LCzGd+TaaD,adTaap ,+aAt]A C4-28) 
式 中 0 二 a 过 1。 式 (4-27) 右 端 中 的 第 二 项 ,由 于 对 J“ [xG) ,i 连续 可 微 的 假设 ,可 以 展 成 
如 下 泰勒 级 数 .: 
J*"[xCGtAt) ,tA 
= [x | EON or Ca) (4-29) 


式 中 oL(Az) ?表示 关于 At 的 高 阶 小 量 ,3J* /3x 的 转 置 则 是 为 了 使 向 量 间 的 相 乘 有 意 
义 。 
将 式 (4-28) 和 式 (4-29) 代 入 式 (4-27), 经 相 消 和 移 项 后 ,得 
9 xt)_ in {LEx C+ aAt) ,ul taAt) ,t+ aAt] 


dt uft ,t+ AA) E 


aJ* [x(Ct),t] ol CAt )? | 
十 | 一 1[zCD dt) tte | 


在 上 式 中 , 令 At 一 0, 考 虑 到 oCAzt)? 是 关于 Az 的 高 阶 无 穷 小 量 , 故 有 


[xz ,ult), 中 | Ss |) flLx(Ct) ,ult), 器 | (4-30) 


式 (4-30) 称 为 哈密 顿 - 雅 可 比方 程 ,又 称 哈密 顿 - 雅 可 比 -贝尔 曼 方程 ,属于 泛 函 与 偏 微分 方 
程 的 一 种 混合 形式 。 
当 控 制 向 量 wlz) 不 受 约 东 时 ,构造 哈密 顿 消 数 
H(xsusaA ,tt)=L(X ut) A Gf Cru,t) (4-31) 
式 中 拉 格 朗 日 乘 子 向 量 


一 一 min， 


Dj 
A (2) 二 本 于 z (4-32) 


因为 J" Lx) ,tj 连续 可 微 , 故 L(x ,wu,t) 及 qLx(ty) ,ti 连续 可 微 ;又 因 f(x,u,i) 连 续 可 微 ， 
故 由 卡尔 曼 的 论证 可 知 ,哈密 顿 画 数 媚 (x,z 2 ,t) 存 在 绝对 极 小 值 。 令 

9 如 _ aL (9f V9 

ou | ox 


J gy 一 一 人 (4-33) 


式 中 
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aL a 


9 ui 9 1 
aL 长 3. 
aL 9 wu, 9 2 _ 9 x, 
9u . 9x 
aL 9 ” 
a ut, dx 
3 万 3 户 . 9. 
9 ui 9 ui gu) 
F T 9fi 9 1 本 昌 闪 9f, 
而 = 9 9 3z 


af 9f, 3, 


Gu, du 9 Ww 
称 为 雅 可 比 和 矩阵 。 
由 式 (4-33) 解 得 最 优 控制 的 隐 含 形式 
a Cab 


将 式 (4-34) 代 人 式 (4-30) ,得 


=—— {Lx 


9 
Di CD , | 


革 T . 
+| 2 fx su CD 一 9 | | (4-35) 


为 了 确定 式 (4-35) 的 唯一 解 J* [Lx(2) ,tj, 尚 需 找 出 该 _ 阶 偏 微分 方程 的 边界 条 件 ， 由 性 能 
指标 表达 式 


Tx C0) 0]=Gx tJ+ | Lr) vale) ,rjdr (4-36) 
令 zt 二 ty, 得 
J[x C7) sts] = Ax) st] 
上 式 对 任意 的 u(t) 均 成 立 , 故 必 有 
J [x trl=A x ts OV CG) tr) EW xX) ,tr (4-37) 
于 是 , 式 (4-35) 和 式 (4-37) 构 成 了 控制 巨 约 束 时 ,哈密 顿 - 雅 可 比方 程 的 第 二 种 形式 。 这 是 
一 阶 偏 微分 方程 及 其 边界 条 件 形式 。 


4.3.3 连续 动态 规划 的 基本 方程 


实际 上 ,哈密 顿 - 雅 可 比方 程 (4-30) 已 经 给 出 了 动态 规划 的 连续 形式 。 这 里 无 非 是 加 
以 归纳 和 进一步 讨论 。 


(1) 最 优 解 的 充分 条 件 
对 于 问题 4-3, 当 w(t)E 0 受到 约束 时 ,由 式 (4- 和 
Bl xD 二 | 守 二 | 于 (YY， wt) | (4-38) 
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一 般 说 来 , 式 (4-38) 是 用 动态 规划 方法 求解 问题 4-3 的 充分 条 件 。 也 就 是 说 ,大 连续 可 微 
的 最 优 性 能 指标 J * LxC) ,tj 满足 式 (4-38), 则 必定 是 所 论 连续 系统 的 最 优 性 能 指标 ,相应 
的 wu (2) 为 最 优 控 制 。 这 一 结论 从 以 下 论述 中 明显 可 见 。 

(2) 险 密 顿 - 雅 可 比方 程 的 解 与 最 优 性 能 指标 的 关系 

卡尔 曼 曾 经 严格 论证 ,指出 : 

Q@ 若 zzti)、 ex(tr)ytir 及 ZLOxyai) 连 续 可 微 , 是 哈密 顿 - 雅 可 比方 程 的 解 
J "Lx() tj 二 次 可 微 , 则 哈密 顿 - 雅 可 比方 程 的 解 是 最 优 性 能 指标 的 必要 且 充 分 条 件 。 

G@) 由 于 哈密 顿 - 雅 可 比方 程 的 求解 十 分 困难 , 且 其 解 不 一 定 存 在 ,所 以 一 般 说 来 , 哈 
密 顿 - 雅 可 比方 程 只 是 最 优 性 能 指标 的 充分 而 非 必 要 条 件 。 

(3) 对 于 线性 二 次 型 问题 ,哈密 顿 - 雅 可 比方 程 的 求解 十 分 简单 ,其 解 是 最 优 性 能 指标 
的 充分 必要 条 件 。 

9 大 f(x,u,t) 和 上 L(x,wu,z) 不 满足 连续 可 微 条 件 , 则 在 哈密 顿 - 雅 可 比方 程 的 推导 过 
程 中 ,J " [x(t 十 Az) ,it 十 At 不 能 展 成 泰勒 级 数 。 此 时 ,哈密 顿 - 雅 可 比方 法 不 能 用 来 求解 连 
续 系 统 的 最 优化 问题 。 

(3) 最 优 解 的 求 取 步骤 

将 式 (4-31) 和 式 (4-32) 代 人 式 (4-30) ,得 问题 4-3 最 优 解 的 充分 条 件 为 


9J* aT* : 
-min Hr | 
然后 按 下 列 步 又 求 出 最 优 解 : 
QD 求 最 优 控制 的 隐 式 解 。 若 u(t) 有 约束 , 令 
H x ,S| minH x (4-40) 
dx ul EN ox 
者 Wu(i) 无 约束 , 今 
aH 9aL 997 _ 
du du du dx | 441) 
a 937) > 人 
du Dr dul at dx 
可 以 求 得 
97 
Wu | Xi ,| (4-42) 


由 于 此 时 .六 [xi ,tj 尚未 求 出 , 故 式 (4-42) 为 隐 式 解 。 
@) 求 最 优 性 能 指标 。 将 求 得 的 式 (4-42) 代 人 哈密 顿 函 数 (4-31) , 便 可 消去 wu* (4) ,得 


， 9 加 .9J” 
H ER 一 到 | YX ,| 
于 是 ,最 优 解 充分 条 件 为 如 下 一 阶 偏 微分 方程 : 
+H' [t= (4-43) 
其 边界 条 件 为 
J xltr) ,ts |= x(t) ,ts], vy (xtp) tr) EY x) ,ty (4-44) 


由 式 (4-43) 和 式 (4-44) 解 出 最 优 性 能 指标 J * [x() ,i]。 
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G) 求 最 优 控 制 显 式 解 。 将 求 得 的 了 *[x(z) ,tj 代入 式 (4-42), 可 得 最 优 控 制 的 显 式 解 
1 | x(t),t | 

出 求 最 优 轨 线 。 将 求 得 的 wu*'Lx(t),tj 代 入 系统 状态 方程 (4-21) ,其 解 为 团 环 系统 最 
优 罗 线 x" (2) ,而 w* [x(),z] 则 实现 了 闭环 反馈 控制 。 

显然 ,用 连续 动态 规划 法 求 问 题 4-3 最 优 解 的 关键 问题 是 方程 (4-43) 及 其 边界 条 件 
(4-44) 可 解 。 但 是 ,除了 线性 二 次 型 问题 , 偏 微分 方程 (4-43) 的 求解 异常 困难 。 

需要 指出 ,对 于 系统 为 线性 、 性 能 指标 为 二 次 型 的 线性 二 次 型 问题 ,可 以 设 最 优 性 能 
指标 为 如 下 二 次 型 函数 : 


J*|x(C), 站 一 到 xzTCDPCDzC) (4-45) 


式 中 PC) 为 待定 的 对 称 非 负 或 对 称 正定 矩阵 。 将 式 (4-45) 代 和信 式 (4-43), 获 得 PC) 应 满 
是 的 黎 上 卞 提 和 矩阵 方程 , 解 此 黎 卡 提 和 抢 阵 方程 ,可 以 求 得 最 优 控制 的 反馈 解 nw* (x) 及 相应 的 
最 优 性 能 指标 ,所 得 结果 与 用 极 小 值 原理 求解 线性 二 次 型 问题 的 结果 完全 一 致 。 

对 于 无 限时 间 线 性 定常 二 次 型 间 题 ,可 以 证 明 ; 最 优 性 能 指标 J * 中 不 显 含 1, 故 可 令 3 
j /9t=0, 

例 4-4 设 线性 定常 系统 

T(t)=Ax(t)+bult), x(0)—=xo 

性 能 指标 


-二 | [x (2)Qx C8) +ru? Ce) Jdt 


式 中 4=[ 0,6 一 | |,zco = 上 |,e=| | 一 到。 试 求 ;最 优 控制 wo)、 最 优 各 


线 x* (和 最 优 指标 J *，。 
解 ”本 例 可 利用 连续 动态 规划 法 求解 。 令 


H me 一 地 x'Qx 十 专 rae? 十 


Dr T 


T 
pr bu 


4x 十 | 2 
Ox 


D 求 ux, 


隐 式 解 。 因 为 xi) 无 约束 , 故 令 


因为 


故 求 得 的 ze: 和 认定 业 入 修 
加 求 J* [x(4)]。 将 求 得 的 wu* | >， :| 代 人 哈密 顿 函数 ， 有 


x EA 二 9J 1/9yJ -97* _ 
Hi |x 2 Loet| | Ax 加) bb ax 
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由 于 被 控 系 统 是 线性 定常 的 ,性 能 指标 中 的 权 阵 CQ 和 7 分 别 为 常 阵 及 常数 , 故 设 

T° [x()]= 5x (Pr) 
式 中 P 了 待定。 由 第 5 章 将 要 介绍 的 无 限时 间 定 常 状 态 调节 器 理论 知 ,P 为 对 称 正 定常 阵 ， 
故 必 有 

adj” 


_1 r,s 
37 ox (i)Px(t)=0 


于 是 , 式 (4-43) 成 为 最 优 解 的 充分 必要 条 件 。 将 上 述 瓦 ' 表 达 式 及 2 一 一 0 代入 式 (4-43)， 
得 哈密 顿 - 雅 可 比方 程 为 


1 T | 1 | 9 . ] = 
7 Ox 十 5 Ax 27 EF b 0 
在 上 式 中 ,代入 
9J” 一 
可 =Px(t) 
可 得 


3 (LIQO+PATATP Por-'b'P]x()—0 


该 式 对 所 有 非 零 的 x(2) 均 成 立 , 故 确定 最 优 性 能 指标 J* [xG)] 的 问题 ,转化 为 求 下 列 黎 
卡 提 和 矩阵 代数 方程 的 解 ， 
PA+AT'™P—Pbr bP+O=0 


~ |Ppu Pz 
一 网 2 
代入 相应 的 4.b.8 及 ,得 如 下 代数 方程 组 : 
一 221: 十 2 一 0 
pu— Zpizpzz—0 
2piz—2p2z=0 
联 立 求解 并 考虑 到 P>0 的 性 质 , 求 得 


_ rr2 1 
p_[? 1 
1 1 
于 是 ,最 优 性 能 指标 
J* [x (2)]= xT (Pr) — 71) + rt) x, (0) + 地 Ct) 


令 1 二 ,代入 本 例 给 定 的 z,(0) 二 1,zxs(0) 二 0, 得 最 优 性 能 指标 值 
J*[x(0)]=1 


今 


人 地) 求 w* 2) 显 式 解 。 


u" (1)=—r br 2 


9x 
可 见 , 最 优 控制 具有 状态 线性 反馈 的 形式 。 

求 x*()。 将 wu G0)== 一 rib Px(z) 代 人 本 例 状态 方程 ,得 闭环 系统 方程 为 
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=—r bPx()=—271()—27r,(1) 


XU)— A—br ib Px()—=Ax(), x(0)=xo 


A=A-br bP=| ,| 
一 
不 难 求 出 ,闭环 系统 的 状态 转移 矩阵 为 
Ror oe e ‘sint | 
LOG 本 — oe ‘sint e ‘(cost—s1nt) 
对 于 状态 调节 髓 问题 ,闭环 系统 的 零 输 入 啊 应 就 是 系统 的 最 优 轨 线 , 故 有 
_ e ‘(cost sint) 
X* (DO 一 exx(O) 一 | , | 
— 2e ‘sint 
将 z? (t 和 xz? (4) 代 入 状态 反馈 形式 的 最 优 控制 ,不 难 求 得 


2U (1)=—2e ‘(cost—sint) 
4.4 动态 规划 与 极 小 值 原理 和 变 分 法 


变 分 法 . 极 小 值 原理 与 动态 规划 ,都 是 研究 极 值 控 制 问题 的 数学 方法 ,因此 必然 存在 
某 种 内 在 的 联系 。 

变 分 法 研究 控制 属于 开 集 的 最 优 控 制 问题 ,通过 欧 拉 方程 和 横 截 条 件 , 可 以 确定 不 同 
情况 下 的 极 值 控 制 。 如 果 容 许 控制 属于 闭 集 , 则 经 典 变 分 法 便 变 得 无 能 为 力 。 因 而 ,出 现 
了 以 极 小 值 原理 和 动态 规划 为 代表 的 现代 变 分 法 。 z 

庞 特 里 亚 金 首先 猜想 并 随 之 加 以 严格 论证 的 极 小 值 原理 ,以 哈密 顿 方式 发 展 了 经 典 
变 分 法 ,以 解决 常 微分 方程 所 描述 的 控制 有 约束 的 变 分 问题 为 目标 ,结果 得 到 了 一 组 常 微 
分 方程 组 表示 的 最 优 解 的 必要 条 件 。 

贝尔 曼 提 出 的 动态 规划 ,以 哈密 顿 - 雅 可 比方 式 发 展 了 经 典 变 分 法 ,可 以 解决 比 常 微 
分 方程 所 描 的 更 具 一 般 性 的 最 优 控 制 问题 ,对 于 连续 系统 ,给 出 了 一 个 偏 微分 方程 表示 的 
充分 条 件 。 

由 于 许多 工程 实际 问题 的 最 优 性 能 指标 不 满足 可 微 性 条 件 ,所 以 能 用 极 小 值 原理 求 
解 的 最 优 控 制 问题 ,未 必 能 写 出 哈密 顿 - 雅 可 比方 程 。 此 外 , 解 常 微分 方程 一 般 比 解 偏 微分 
方程 容易 ,因此 极 小 值 原理 比 动 态 规划 好 用 .但 是 ,求解 离散 最 优 控 制 问题 时 , 却 是 用 动态 
规划 更 加 方便 ,应 用 范围 更 广 . 由 于 动态 规划 结论 是 充分 条 件 , 故 便于 建立 动态 规划 . 极 小 
值 原理 与 变 分 法 之 间 的 联系 。 当 然 , 对 于 同样 能 用 这 三 种 方法 求解 的 最 优 控制 问题 ,所 得 
到 的 结果 应 该 是 相同 的 。 z / 


4. 4. 1 动态 规划 与 变 分 法 
动态 规划 与 变 分 法 密切 相关 。 变 分 法 的 基本 问题 是 确定 最 优 轨 线 zx* (2) ,使 泛 隐 
J=| Lr, zd (4-46) 


取 极 小 值 。 式 中 ,及 i 固定 ,z(1) 是 连续 可 微 的 标量 函数 。 
若 令 
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Z(t) =ult) (4-47) 

将 式 (4-47) 代 入 式 (4-46), 则 变 分 问题 转化 为 :对 于 系统 (4-47) ,要 求 最 优 控 制 w* (2), 使 
性 能 指标 : 

J=| Lor ,tdt (4-48) 


取 极 小 值 。 其 中 (2) 不 受 约束 。 
这 时 , 变 分 法 的 所 有 结果 都 可 由 动态 规划 法 导出 。 下 面 分 三 种 情况 讨论 。 
(1) 两 端 固定 情况 
当 两 端 固定 时 ,系统 方程 (4-47) 的 边界 条 件 为 
Xlto)—=zo0, X(t/)=ry 


假定 连续 动态 规划 的 全 部 条 件 成 立 , 则 险 密 顿 - 雅 可 比方 程 为 


一 一 mn 十 号 
或 写 为 
min {L(xu 办 十 写生 = 0 (4-49) 
令 险 密 顿 肾 数 z 
Dj 
H=L(z,u,t) 十 一 一 一 忒 (4-50) 
dz 
则 式 (4-49) 可 写 为 
min { 太 + 写 |=0 (4-51) 
因为 u(i) 无 约束 , 故 令 
oaH aL 9" 
EE 二 37 十 本 二 本 二 一 0 (4-52) 
解 得 
oa" aL 
本 一 一 有 (4-53) 
取 式 (4-52) 对 上 的 偏 导数 ,有 
9°L .9J* 
Qtau 9t9xr 
解 得 
9 “7 
tx dt9u (4-54) 
从 式 (4-52) 中 解 出 的 代入 式 (4-49)， 自然 有 
Cry 十 二 一 一 “十 2 一 一 
9 .027* 
5 十 区 | dx S| 十 25 一 0 (4-55) 


将 式 (4-53) 和 式 (4-54) 代 入 式 (4-55), 是 令 二 <, 得 
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aL 9 19L. a2L l 
5 一 天 | 3 Es at9z 4-56) 
考虑 到 
daL aL 交 a2L 
di19az Xaz™ Di 元 
式 (4-56) 可 写 为 
aL doarL 


这 就 是 众所周知 的 欧 拉 方 程 。 

由 于 在 推导 欧 拉 方程 时 , 先 作 了 最 优 解 存在 , 即 哈密 顿 - 雅 可 比方 程 成 立 的 假定 ,所 以 
导出 的 欧 拉 方 程 (4-57) 代 表 的 是 必要 条 件 。 

在 连续 动态 规划 中 , 式 (4-51) 有 极 小 值 的 男 一 条 件 是 


du? 之 0 (4-58) 
将 式 (4-50) 及 式 (4-47) 代 入 上 式 , 求 得 

D27 

可 友之 0 (4-59) 


这 就 是 勒 让 德 条 件 , 也 是 使 泛 阴 (4-46) 取 极 小 值 的 必要 条 件 ，。 
至 于 求解 欧 拉 方 程 (4-57) 所 需 的 两 点 边 值 条 件 , 已 由 已 知 初 态 和 末 态 条 件 所 给 出 。 
(2) 目 由 起 点 情况 
当 起 点 自由 时 ,由 变 分 法 得 到 的 横 截 条 件 为 


oaL 
1 
这 一 结论 亦 可 由 连续 动态 规划 导出 。 
因 起 点 自由 , 改 最 优 轨 线 z" (2) 的 初始 值 zo* 必 对 应 最 优 性 能 指标 . 广 Lz(Go ,tj 在 i= 
to 时 的 极 小 值 感 ， 目 然 应 有 


一 0 (4-60) 


to 


a * 
EE ， (4-61) 
将 式 (4-53) 和 式 (4-47) 分 别 代 入 式 (4-61), 立 即 得 到 式 (4-60)。 
(3) 目 由 终点 情况 
当 终 点 目 由 时 ,由 变 分 法 得 到 的 横 截 条 件 为 
Ed 一 (4-62) 


由 连续 动态 规划 法 知 , 此 时 应 有 
AD=| | 一 0 


代 人 式 (4-53) 和 式 (4-47) ,立即 可 得 式 (4-62) 。 
当 末 剖 受 约束 时 , 变 分 法 中 更 为 一 般 情 况 下 的 横 截 条 件 , 也 可 以 方便 地 根据 蛤 密 顿 - 
雅 可 比方 程 导 出 。 读 者 不 妨 目 行 论证 。 
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4.4.2 极 小 值 原 理 与 变 分 法 


当 起 点 国定 ,z(to) 王 zo 时 ,使 泛 函 (4-46) 取 极 值 的 必要 条 件 是 欧 拉 方 程 (4-57) 成 立 。 


这 一 结论 ,也 可 以 对 系统 (4-47) 和 性 能 指标 (4-48) 应 用 极 小 值 原理 方便 地 导出 。 


根据 极 小 值 原理 ,构造 哈密 顿 隔 数 
HH=L(r,w it) TAC Dau() 
由 正则 方程 
sl aL 
AD) 一 一 5 一 一 于 
因 zx (2) 无 约束 , 故 极 值 条 件 为 
AaH aL 
5 一 3 
解 得 
aL 
Ai) 一 一 可 
上 式 对 : 求 导 ,有 
d aL 
Ab) 一 一 下 了 
比较 式 (4-63) 和 式 (4-64) ,得 
aL da _。 
oz diau 
因为 :一 工 , 放 欧 拉 方程 为 
2L_d93L_ 
az dtaz 


(4-63) 


(4-64) 


应 用 极 小 值 原理 的 结论 ,还 可 以 方便 地 得 到 变 分 法 中 的 各 种 横 截 条 件 。 这 充分 表明 ， 


经 典 变 分 法 是 极 小 值 原理 的 特 款 。 
4. 4. 3 动态 规划 与 极 小 值 原理 


考虑 如 下 问题 ,已 知 系统 状态 方程 
*(t)= flxC) ,W(t) ,tt |, x(to) = Xo 
式 中 ,x() ER",wu(t) ER”"。 要 求 确定 最 优 控 制 u* (2)ED, 使 性 能 指标 


J=qd rty) t+ | Lor td 


取 极 小 值 。 其 中 x(t) 自由 ;tj 或 固定 ,或 自由 。 
(1) 未 端 时 刻 固 定 情 况 


(4-65) 


(4-66) 


当 tj 固定 时 ,上 述 问题 是 时 变 系 统 、 复 合 型 性 能 指标 .tj 固定 和 末端 自由 的 最 优 控制 


问题 。 根 据 极 小 值 原理 ,上 述 问题 的 最 优 解 应 满足 如 下 必要 条 件 ， 
正则 方程 为 


1 = 一 2 既 


,98 


式 中 哈密 顿 函 数 
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HlxysusA ,tt) ,= Lx ui) HA (Gf EL) 


边界 条 件 为 
9G xt) ,ty) 


(to) 一 za， Ci 站) 一 一 


极 小 值 条 件 为 
五 (xX,A su "minl (x,A st) 


上 述 结 论 , 也 可 以 利用 哈密 顿 - 雅 可 比方 程 导出 ,假定 最 优 性 能 指标 J" [x(z) ,tj 存在 ， 
且 连 续 可 微 。 根 据 连 续 动态 规划 法 ,哈密 顿 - 雅 可 比方 程 为 如 下 一 阶 仿 微 分 方程 ; 


a0” ,1 ay 1 | 
sr + ER (4-67) 
其 边界 条 件 为 : 
J [xCir)t = x(ty) st (4-68) 
式 中 
H' [r,t) =minH x | (4-69) 
Ax 在 和 站 dr 
而 
oJ 
HIxu,—— 了 | -Lu +| 疆 | f(xsu,t) (4-70) 
a [x,t)| 
知 A (1) 一 or (4-71) 
必 有 
(2) 一 二 f(t) (4-72) 
Hr Ce so ,=minH x,A SU,t) (4-73) 


式 (4-73) 表 明 ,在 保持 x, ,i 不 变 的 条 件 下 ,选择 w(t)EQ, 使 瑟 取 全 局 极 小 值 ,这 就 是 极 
小 值 原理 中 的 极 小 值 条 件 。 式 (4-72) 显 然 为 状态 方程 。 
将 式 (4-71) 对 zt 取 全 导数 ,有 
d FaJ* x,t)] 321 xt) 92 "(x,t) 
于 | ax |= Qt19x 十 Oxox! 
9 T9771], 9" (r,t) 
-元 | Di |+ dxax! 
将 式 (4-67) . 式 (4-69) 和 式 (4-70) 代 入 上 式 ,得 


2 yx 
4 0)= 一 去 | Zr， u 0 二 | | fx, u 4) | 十 号 Gray 


A()= 


fx Wst) 


OCX st) 92J* (x,t) 、 
一 一 Cr ,) 


四 er 二 一 人 生生 Jr， ut) 


因为 已 设 J*Lx(z) ,tj 存在 且 连 续 可 微 , 故 有 wu()==w* (2), 且 已 令 4 (44) 二 39J*/9x, 于 是 上 
式 可 与 为 


9 到 (CCXA ,nu,t) 


FE (4-74) 


40)=— Lu tA Ft) ]=— 
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这 就 是 协 态 方程 。 
由 边界 条 件 (4-68) ,并 考虑 到 式 (4-71) ,得 


2 | OHXC Dt (4-75) 
gx 


这 就 是 横 截 条 件 。 

这 样 ,在 假定 J* Lx() ,tj 存在 有 旦 连续 可 微 的 条 件 下 ,由 哈密 顿 - 雅 可 比方 程 (4-67) 及 
其 边界 条 件 (4-68) ,导出 了 极 小 值 原理 给 出 的 全 部 必要 条 件 。 

(2) 末 端 时 刻 月 由 情况 

由 极 小 值 原理 知 , 对 于 所 讨论 的 问题 ,在 最 优 解 应 满足 的 必要 条 件 中 , 除 与 tj 固定 时 
相同 的 必要 条 件 外 ,还 有 一 个 必要 条 件 是 囊 变化 律 应 为 
: 9d x ) ,tr | 


DB’ [xi AGED) (1) ,ty | 一 一 :yp (4-76) 
在 连续 动态 规划 中 , 取 边 界 条 件 (4-68) 对 zj 的 偏 导 数 , 得 
2 RFD sty, (4-77) 


Qt | ofr 
令 tj 二 tf? ,并 利用 式 (4-67) 和 式 (4-71) ,立即 得 到 式 (4-76)，。 

不 难看 出 , 当 妨 自由 时 ,前 面 导 出 的 式 (4-72) 、 式 (4-73)、 式 (4-74) 以 及 式 (4-75) 仍 然 
成 立 。 

应 当 指 出 ,以 上 推 证 只 有 形式 上 的 意义 ,不 能 认为 是 极 小 值 原理 的 严格 证 明 。 实 际 上 ， 
除了 线性 二 次 型 问题 外 ,哈密 顿 - 雅 可 比方 程 难以 求解 ,或 者 根本 不 存在 二 次 连续 可 微 的 
清 数 J*[x(z),tj。 但 是 ,上 述 推 证 揭示 了 变 分 法 、 极 小 值 原理 与 动态 规划 之 间 的 内 在 联 
系 ,使 读者 对 这 三 种 方法 的 应 用 条 件 及 相互 关系 有 更 深入 的 了 解 。 
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4-1 设 拟 建 设 的 天 然 气管 道 网 如 图 4-5 所 示 。 图 中 A、B、C、…、L 表示 压缩 机 站 ,各 
级 段 上 的 箭头 表示 确定 的 天 然 气流 动 方 向 ,线段 上 的 数字 则 表示 各 管 段 的 流通 能 力 , 试 求 
该 网 络 从 起 点 4 到 终点 工 的 最 大 流通 能 力 及 相应 的 最 优 路 径 。 

4-2 ”一 位 公务 员 乘 坐 出 租 汽 车 要 从 机 场 赶 到 会 场 参 加 重要 会 议 , 已 知 交通 网 络 如 图 
4-6 所 示 。 图 上 数字 为 每 条 支 路 的 驾驶 时 间 , 生 全 部 支 路 都 是 单行 线 。 试 用 动态 规划 找 出 
到 达 会 场 的 最 短 时 间 路 线 。 


图 4-5 天 然 气 管道 网 络 
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图 4-6 交通 网 络 


4-3 设 离散 系统 方程 
Z (有 十 1) 一 工 (有 ) 十 了 (CR) 


性 能 指标 
3 
J= > [rk) Hulk) rE) tu (kr) 0 


式 中 wu(%) 限 取 十 1 或 一 1]。 要 求 末 端 状态 为 x(4) = 二 2。 试 求 最 优 控制 x" (4) 和 最 优 轨 线 
x (k),k=0,1,2,3, 
4-4 设 二 阶 离散 系统 
Zi(R 十 1) 一 2zi() 十 zx)， zi(0) 一 ] 
Xz(k 二 1) 二 XxX1(k) 十 Xs(k)， zz(0) 一 0 
试 求 使 性 能 指标 


1 
J 一 >,[2z8(R 十 1) 十 2x2(&)] 
k=0 


为 极 小 的 最 优 控 制 w* (%) 和 最 优 轨 线 xz" (k)。 
4-5 已 知 生产 库存 系统 的 状态 方程 为 
ZT(k+1)=rR) Hu(k) — wk) 
式 中 zx(4) 表 示 库 存量 ,w (4%) 表示 生产 量 ,w (4) 表 示 销 售 量 。 假设 生产 费用 等 于 
0. 005w:(%) ,库存 费用 等 于 xz(%), 则 一 年 的 总 费用 为 


3 
J = >,[0. 005x2(&) 十 工 ( 有 ) ] 


设 初始 库存 量 x(0)= 二 0, 四 个 季度 的 订货 分 别 为 :w (0)==600,w(1)= 二 700,w(2)= 
500,z(3) 王 1200。 耕 要 求 到 年 底 无 积存 , 即 要 求 z(4)= 二 0, 试 求 使 总 费用 J 为 最 小 的 各 季 
度 最 优生 产量 u* (0) .zx (1)、u' (2) 和 ww* (3)。 

4-6 设 离散 系统 状态 方程 

Zi(R 十 17) 一 (有 ) 
Xs(k 二 1)=zxi (Rk) 二 zr,(k) uk) 
控制 约束 wk) EQ= {一 1,0, 十 1} ,边界 条 件 
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X1(0)= 二 一 ]， XxX.(0)=]1 
ZIiK3) 一 0， X22(3) 二 一 2 
试用 动态 规划 法 确定 最 优 控制 序列 wu* (8) ,使 下 列 性 能 指标 极 小 : 
J= OLlu(k)|—zi() 20 
4-7 已 知 一 阶 离散 系统 


ZKR 十 1) 一 ZJUCR) 二 CR)， rx0)=1 
控制 约束 x(&)EBC=( 一 1,0, 十 1) ,试用 动态 规划 法 计算 使 


2 
J= > {rcR)|+3lu (+1|}+ |x(3) |.0 
= 二 0 


为 最 小 的 最 优 控 制 序列 ww* (0),w* (1) ,wu* (2)。 
4-8 已 知 系 统 状态 方程 
XZ1(t)=7T ft), ICO) 一 10 
Taot) 一 zt， ZrC0) 一 on0 
性 能 指标 
JJ 一 到 | | 4x1 (1) +u’ (7) jd 


试 瑟 出 该 系统 的 哈密 顿 - 雅 可 比方 程 , 并 求 最 优 控制 u* (4) 和 最 优 指标 J *。 
4-9 已 知 二 阶 系统 方程 
pt 十 DC 一 zt) 


假定 9() 和 9 (可 以 直接 量 测 ,力矩 x(i) 不 受 限 制 。 试 求 使 性 能 指标 
J 一 | [GD 十 6 十 weGD]d 
为 最 小 的 控制 uw* (2)，。 
4-10 设 标 量 非 线性 系统 
tlt)=f (zr) pu lt) 
性 能 指标 


1=| [+42) dt 


试 证 ;哈密 顿 - 雅 可 比方 程 按照 3.1* /3z 是 二 次 的 ,按照 93J* /91 是 线性 的 。 
4-11 已 知 一 阶 系统 
: T(t)—=ult), z(to)=xo 


性 能 指标 
=x (ty) +| Ez (£2) au (4) dt 


试用 连续 动态 规划 求 最 优 控 制 w* (4) 和 最 优 指标 7*。 
4-12 已 知 一 阶 系统 


z(t)=—57(t) ud) 


性 能 指标 
7= 卫 [10z2(1)] 十 广 | [2z2G) tw Ce) Jde 


试用 连续 动态 规划 求 最 优 控 制 zx” (1)。 
4-13 已 知 二 阶 系统 
ZZ1(t)=u(t), rx1(0)=0 
Zi 一 ii， rx.(0)=1 
性 能 指标 
7 一 到 | 233 二 二 2 |d 
试用 连续 动态 规划 求 最 优 控制 x&” (z) 和 最 优 轨 线 z” (ti) 。 
4-14 已 知 系统 方程 
z(t) = x (t) 
z(t)=— zt) — rt) u(t) 
性 能 指标 
J=| Lz) +u le) Jd 


斌 确定 该 系统 的 哈密 顿 - 雅 可 比方 程 。 
4-15 设 系 统 方程 为 
X(t) = Ax(t) Tu() 
式 中 ,xE€ R",u€ R",A 为 常 阵 且 满足 
A 十 4 二 0 
控制 约束 uQ) 三 1。 性 能 指标 


试 证 :该 系统 哈密 顿 - 雅 可 比方 程 的 解 为 
J(x)= lx) 
并 问 最 优 控 制 u* G2) 形式 如 何 ? 
4-16 设 一 阶 非 线 性 系统 方程 为 
zt) 一 一 CC 十 zt Z(0) 一 To 
性 能 指标 


J=3| [zz 上 wd)]d 
0 
硅 设 

J ~aotart > ja 3 az 十 厂 


式 中 ai 待定 ,i 一 0,1,2,3,4。 六 用 连续 动态 规划 最 优 控制 u” (1)。 
4-17 设 一 阶 系统 
T(t)= ku lt) 
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性 能 指标 
7 一 | [ez 十 ru:(t) Jdt 
式 中 g 和 7 为 正常 数 。 给 定 t= 二 tj 时 ,ztr) 一 Zr 设 
J* (Cx) =A TE) TFA z(t) 
试用 动态 规划 求 该 系统 的 黎 卡 提 方 程 。 
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第 5 章 线性 最 优 状 态 调节 器 


如 果 所 研究 的 系统 为 线性 ,所 取 的 性 能 指标 为 状态 变量 与 控制 变量 的 二 次 型 孙 数 , 则 
这 种 动态 系统 的 最 优化 问题 , 称 为 线性 二 次 型 问题 ,由 于 线性 二 次 型 问题 的 最 优 解 具有 统 
一 的 解析 表达 式 , 且 可 导致 一 个 简单 的 状态 线性 反馈 控制 律 , 便 于 计算 和 实现 闭环 反馈 控 
制 ,因此 引起 了 控制 工程 界 的 极 大 关注 ,成 为 最 优 控 制 理论 及 应 用 中 最 成 熟 的 部 分 。 

线性 二 次 型 最 优 控制 除 易 于 实现 .具有 工程 性 外 ,还 具有 如 下 明显 的 特点 :线性 最 优 
控制 的 结果 可 以 应 用 于 工作 在 小 信号 条 件 下 的 非 线 性 系统 ,其 计算 和 实现 比 非 线 性 控制 
方法 容易 ;线性 最 优 控制 器 设计 方法 可 以 作为 求解 非 线性 最 优 控制 问题 的 基础 :线性 最 优 
控制 除 具有 二 次 型 性 能 指标 意义 上 的 最 优 性 外 ,还 具有 展 好 的 频 啊 特性 ,可 以 实现 极点 的 
最 优 配置 ,并 可 抗 慢 变 输 入 扰动 ,从 而 沟通 了 现代 控制 理论 与 经 典 控制 理论 之 间 的 联系 。 

线性 二 次 型 最 优 控制 的 基本 内 容 可 以 分 为 :最 优 状 态 调节 .最 优 和 输出 调节 和 最 优 跟 
踪 。 可 以 证 明 ,最 优 和 输出 调节 问题 和 最 优 跟 踪 问 题 都 可 以 化 为 最 优 状 态 调节 问题 。 

本 章 主要 研究 最 优 状 态 调 节 硕 的 基本 理论 及 其 扩展 ,最 优 状态 调节 器 的 基本 性 质 及 
其 应 用 。 至 于 最 优 输 出 调节 带 及 最 优 跟踪 系统 问题 ,将 在 第 6 章 介绍 。 


5.1 线性 二 次 型 问题 


研究 线性 二 次 型 问题 ,一 方面 是 因为 这 类 问题 在 工程 实际 中 经 常 遇 到 ; 另 一 方面 是 因 
为 在 数学 处 理 上 比较 简单 ,可 以 得 到 用 解析 形式 表达 的 线性 反馈 控制 规律 ,便于 工程 
实现 。 
设 线性 时 变 系 统 的 动态 方程 为 
XH)=ACGXO) BOOuG), (to) 一 2 (5-1) 
y(t)=C(t)x(t) 
式 中 x(1) 为 n 维 状 态 向 量 ,u(i) 为 m 维 控制 向 量 ,y() 为 ! 维 输出 向 量 ;4( .BCD) CCD) 为 
维 数 适当 的 时 变 和 矩阵, 其 各 元 分 段 连续 且 有 界 , 在 特殊 情况 下 可 以 是 常 阵 4.8.C。 假 定 
0 二 /二 m 研 n, 且 ww() 不 受 约束 。 
在 工程 实际 上 总 是 希望 这 样 来 控制 系统 :使 系统 输出 尽量 接近 某 一 希望 输出 。 若 令 
7 表示/ 维 希望 输出 向 量 , 则 
e(t)=y(2)—y0) (5-2) 
称 为 误差 向 量 。 要 求 确定 最 优 控制 u* (4) ,使 下 列 二 次 型 性 能 指标 极 小 : 
J=e DFeG) t+] Le (Qed) tu (Ru) Jdt (5-3) 
式 中 下 为 人 Xl 维 对称 非 负 定 常 阵 ,Q GQ) 为 1X1i 维 对 称 非 负 定时 变 矩 阵 ,RG) 为 mxXm 维 
对 称 正定 时 变 和 矩阵 ,初始 时 刻 t。 和 末端 时 刻 tj 固定 。 在 今后 的 问题 讨论 中 ,若非 特别 指 
出 ,以 上 假定 始终 满足 。 
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为 了 便于 工程 应 用 ,性 能 指标 (5-3) 中 的 权 和 矩阵 Q(t) 和 R(i) 往 往 取 为 对 角 线 型 矩 
阵 , 则 其 对 称 性 自然 满足 ,需要 指出 的 是 ,如 何 根 据 系 统 的 实际 要 求 选 择 加 权 短 阵 的 诸 元 ， 
绝 不 是 一 个 简单 的 问题 ,其 理论 和 方法 至 今 仍 未 能 很 好 地 解决 。 

在 二 次 型 性 能 指标 (5-3) 中 ,其 各 项 都 有 明确 的 物理 含义 。 现 分 述 如 下 。 

(1) 末 值 项 


Helsn)]= Fe Felis) (5-4) 
不 失 一 般 性 , 取 FF==7, 表 示 对 末 态 误差 要 求 的 各 元 等 加 权 , 则 有 
er GDeG)= ed) N= Vater... to) , 
此 时 , 末 值 项 表示 tj 时 刻 的 跟踪 误差 , 即 末 态 误差 向 量 e(iy) 与 希望 的 零 向 量 之 间 的 距离 
平方 和 。 


当 FF 之 0 时 ,表示 对 末 态 跟踪 误差 的 各 元 有 不 同 的 要 求 。 若 取 
F=diag{\fi,f;,*" ,fi)} 20 


则 式 (5-4) 可 以 表示 为 

Hels)]=3 fe le) 
式 中 系数 1/2 是 为 了 便于 运算 。 此 时 , 末 值 项 表示 末 态 跟踪 误差 向 量 e(1/) 与 希望 的 零 向 
量 之 间 的 距离 加 权 平 方 和 。 

由 此 可 见 , 二 次 型 性 能 指标 中 的 末 值 项 ,表示 在 控制 结束 后 ,对 系统 末 态 跟踪 误差 的 
要 求 。 由 于 在 有 限时 间 ty 内 ,系统 难以 实现 使 el(ty) = 二 0, 因 此 要 求 gLe (ty) | 位 于 零 的 某 一 
邻 域内 , 既 符 合 工程 实际 情况 ,又 易于 满足 。 

如 采 对 末 态 跟踪 误差 不 必 限 制 , 则 可 取 FF=0。 此 时 性 能 指标 J 变 为 积分 型 。 

(2) 第 一 过 程 项 


| ‘Ldt=3| er Qe dt (5-5) 


夺取 
Q(t)=diag{gi(t) ,g(t), ,g(t)} 之 0 


则 有 
]. 一 地 er (2 OQ (te(#) = 加 9 (t)er (ti 过 0 
于 是 , 式 (5-5) 可 以 表示 为 
1 i ! 
| 。 [dt 一 到 | ACLAGHL 


上 式 表明 ,第 一 过 程 项 表示 在 系统 控制 过 程 中 ,对 动态 跟踪 误差 加 权 平 方 和 的 积分 要 求 ， 
是 系统 在 运动 过 程 中 动态 跟踪 误差 的 总 度量 。 
(3) 第 二 过 程 项 


| Ldt=#| Ww Ru ds (5-6) 


硬 取 
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RG()=diag{r CG) rs Ct) ,rnt)}>0 
则 有 
L.— Fu (Ru ) ~ 上 Dru > 
于 是 , 式 (5-6) 可 以 表示 为 
[= 了 Dr 


上 式 表明 ,第 二 过 程 项 表示 在 系统 控制 过 程 中 ,对 系统 加 权 后 的 欣 制 能 量 消 耗 的 总 度量 。 

根据 上 述 分 析 可 知 ,二 次 型 性 能 指标 (5-3) 的 物理 意义 是 :使 系统 在 控制 过 程 中 的 动 
态 误 差 与 能 量 消耗 ,以 及 控制 结束 时 的 系统 稳 态 误差 综合 最 优 。. 至 此 ,读者 可 以 明白 ,从 性 
能 指标 的 物理 意义 来 看 , 权 和 矩阵 .OG() 和 RG() 都 必须 取 为 非 负 和 矩阵 ,不 能 取 为 负 定 和 矩阵; 
否则 有 共有 大 误差 和 控制 能 量 消 耗 很 大 的 系统 ,仍然 会 有 一 个 小 的 性 能 指标 ,从 而 违背 了 最 
优 控 制 的 原意 。 至 于 要 求 权 矩阵 RG) 正 定 , 那 是 由 于 最 优 控 制 律 的 需要 ,以 保证 最 优 解 的 
存在 。 

二 次 型 性 能 指标 有 如 下 几 种 重要 的 特殊 情形 。 

(1) 状 态 调 节 部 问题 

在 系统 方程 (5-1) 和 误差 向 量 (5-2) 中 ,如 果 

z Ci 一， y(t)=0 
则 有 
et) 一 一 yt) 一 一 大 人) 

从 而 ,性 能 指标 (5-3) 演 变 为 


7 一 x CG Fx Cs) 十 亏 | xT I OO Hu OR di (5-7) 


这 时 ,线性 二 次 型 问题 归结 为 : 当 系 统 受 扰 偏离 原平 衡 零 状态 时 ,要 求 系统 产生 一 控制 向 
量 ,使 性 能 指标 (5-7) 极 小 ,即使 得 系统 状态 x() 始 终 保持 在 零 平 衡 状 态 附近 。 因 而 ,这 一 
类 线性 二 次 型 最 优 控制 问题 称 为 状态 调节 器 问题 。 

(2) 输 出 调节 器 问题 

在 误差 向 量 (5-2) 中 ,如 果 


人 (1 一 人 
则 有 
e(t)=— y(t) 
从 而 ,性 能 指标 (5-3) 演 变 为 
J 二 二 (tr)Fy (ty) 十 到 | [yr (COCDYCD 十 2 RuG) Jdi (5-8) 


这 时 ,线性 二 次 型 问题 归结 为 : 当 系 统 受 扰 偏离 原 零 平 衡 状态 时 ,要 求 系统 产生 一 控制 向 
量 , 使 性 能 指标 (5-8) 极 小 ,即使 得 系统 输出 y(z) 始 终 保持 在 零 平 衡 状态 附近 。 因 而 ,这 一 
类 线性 二 次 型 最 优 控制 问题 称 为 输出 调节 器 问题 。 

3) 跟踪 系统 问题 

如 果 7 天 0, 式 (5-2) 成 立 , 性 能 指标 保持 式 (5-3) 的 形式 不 变 , 则 线性 二 次 型 问题 
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归结 为 : 当 希 望 输出 量 记 ( 刀 作用 于 系统 时 ,要 求 系 统 产 生 一 控制 向 量 , 使 性 能 指标 (5-3) 
极 小 ,即使 得 系统 的 实际 输出 y(?) 始 终 跟 随 y,(2) 的 变化 。 因而 ,这 一 类 线性 二 次 型 最 优 控 
制 问题 称 为 跟踪 系统 问题 。 


5.2 状态 调 闻 条 


所 谓 状 态 调 节 器 问题 ,就 是 要 求 系统 的 状态 保持 在 平衡 状态 附近 。 当 茶 种 原因 使 系统 
的 状态 偏离 平衡 状态 时 ,就 对 系统 进行 控制 使 之 回 到 原平 衡 状 态 . 工 业 上 的 许多 控制 问题 
部属 于 这 一 类 。 例 如 ,电网 电压 的 控制 ,温度 控制 以 及 压力 控制 等 。 

对 于 线性 定常 系统 ,任何 平衡 状态 通过 线性 变换 均 可 转化 为 零 状 态 。 为 方便 起 见 , 通 
崩 将 系统 的 等 状态 取 为 平衡 状态 、 

由 于 在 线性 二 次 型 最 优 控制 问题 中 通常 不 考虑 控制 的 不 等 式 约束 ,因此 变 分 法 、 极 小 
值 原理 或 动态 规划 都 可 以 用 来 求解 状态 调节 器 问题 。 本 节 将 利用 极 小 值 原理 和 连续 动态 
规划 推 证 有 限时 间 状 态 调 节 器 和 无 限时 间 状 态 调节 器 的 主要 结果 ,并 对 无 限时 间 定 常 状 
态 调 广 颖 的 稳定 性 进行 论证 。 


5.2.1 有 限时 间 状 态 调 节 器 


问题 5-1 攻 线 狂 时 变 系 统 状态 方程 为 
TX(2)—=ACGIXD HBOu), x(lto)=xo (5-9) 
式 中 x(1) ER ;u(t) ER”;u(t) 无 约束 ;和 窍 阵 A4() 与 BG) 维 数 适当 ,其 各 元 连续 日 有 界 。 要 
求 确定 最 优 控制 & (2) ,使 下 列 性 能 指标 极 小 、 


了 一 xT (7) Fx Cts) 二 二 | Cr (Ox Hu GIROGuCG) ld (5-10) 


式 中 权利 阵 下 一 太 人 0,0GD) 王 OIC) 过 0,RC) 一 RTCG) 盖 0, 其 各 元 均 连 续 有 界 ;末端 时 刻 
tf 固定 且 为 有 限 值 。 

下 面 分 别 对 上 述 问题 最 优 解 的 存在 性 .唯一 性 以 及 相应 黎 卡 提 方 程 解 的 对 称 性 .正定 
性 加 以 论述 。 

(1) 最 优 解 的 充分 必要 条 件 

定理 5-1 对 于 最 优 调节 器 问题 5-1, 最 优 控 制 的 充分 必要 条 件 是 

u’ (2)——R 1CG)B'G)PG)x() / (5-11) 

最 优 性 能 指标 为 


J = Fx (P(x) (5-12) 


式 中 nXn 维 对 称 非 负 和 矩阵 PC) 满足 黎 卡 提 和 矩阵 微分 方程 
—PG)=—=PG)AG)THATGPG)— PGBGR CG)BT (2 P(E) OW) (5-13) 
其 边界 条 件 为 


P(/)=F z (5-14) 
而 最 优 轨 线 x" (), 则 是 下 列 线性 向 量 微分 方程 的 解 : 
(1) =AG)— BOGOR GB GPG) GyY(Ct) 一 2 (5-15) 
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延明 


必要 性 : 设 w" (2) 是 问题 5-1 的 最 优 控制 , 则 必 满 足 极 小 值 原理 。 令 哈密 顿 郴 数 


H= x (QD x + su (Ru) 


ATGACGXG) HA BG uw) 


(5-16) 


由 于 zx) 不 受 约束 ,所 以 极 小 值 条 件 是 哈密 顿 函 数 (5-16) 对 xi) 取 无 条 件 极 小 .根据 驻 值 


条 件 
H T 
= 二 RODDWu)+FB CA (it)=0 
ou z 
得 z 
u(t)=—R (BGA CE) 
因为 
5 一 RC)>0 
所 以 式 (5-17) 是 使 哈密 顿 函 数 取 极 小 的 控制 。 
由 正则 方程 ,得 


#()— SI = A — BWR) BT (4) 


4 (#)= -一 Or) — ATOA (#) 
因为 末 态 x(t/) 自 由 所 以 机 藏 条 作为 
4 (=F | 二 xT (Px) |= Fx(i ) 


令 协 态 方程 (5-19) 的 解 为 
A()=POxG), ViE[t,ty)] 
式 中 和 矩阵 PG) 待定 。 上 式 对 时 间 z 求 导 , 得 
AG)=PO)xrCt)+PO)rG) 
将 式 (5-21) 代 入 式 (5-18), 则 状态 方程 可 写 为 
i(t)=[AG)—BGR GG) BT PG) 人) 


(5-17) 


(5-18) 


(5-19) 


(5-20) 


(5-21) 


(5-22) 


(5-23) 


式 (5-23) 为 最 优 闭环 系统 方程 ,其 在 给 定 初 态 x(io) 二 x。 下 的 唯一 解 正 是 最 优 轨 线 x (4)， 


于 是 式 (5-15) 得 证 。 z 
将 式 (5-23) 代 入 式 (5-22), 协 态 方程 为 


A C2)=[LPG)+PO)AG)—PHBG)RT BT uPG) lr) 


将 式 (5-21) 代 入 式 (5-19), 则 协 态 方程 又 可 表示 为 
1 (一 一 [CC 十 4TCDPCD Jr 人 Ci) 
比较 式 (5-24) 与 式 (5-25), 得 PQ) 应 满足 如 下 矩阵 微分 方程 ， 


—P()=PUACG)+A PEG) —PG) BGR 1 GBT OH)PG) +OUu) 
式 (5-26) 通 常 称 为 黎 卡 提 和 矩阵 微分 方程 ,简称 黎 卡 提 方 程 。 因 此 , 式 (5-13) 得 证 。 


在 式 (5-21) 中 , 令 zt 一 tj, 可 得 
A (1t/)= P(E) x (ty) 
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(5-24) 


(5-25) 


(5-26) 


(5-27) 


式 (5-27) 与 横 截 条 件 (5-20) 相 比 , 可 知 黎 卡 提 方 程 (5-26) 应 满足 的 边界 条 件 为 
P(ir) 一 已 (5-28) 
因此 , 式 (5-14) 得 证 。 至 于 P(#) 的 对 称 性 和 非 负 性 ,将 在 下 面 论证 。 
将 式 (5-21) 代 入 式 (5-17) ,得 最 优 控制 的 必要 条 件 为 
8 (4)=—R 0G)B' (PG)xC) (5-29) 
于 是 , 式 (5-11) 的 必要 性 得 证 。 
充分 性 : 设 式 (5-11) 成 立 , 其 中 P() 满 足 黎 卡 提 方程 (5-13) 及 其 边界 条 件 (5-14)。 由 
连续 动态 规划 知 ,和 蔡 式 (5-11) 满 足 哈 密 顿 - 雅 可 比方 程 , 则 充分 性 成 立 。 
在 令 
Lrsut)=3 [x (QD x Fu (RW) 


fAXIUt) = A XxX) TB u(t) 
则 哈密 顿 0 


H =L(xyust) + 2) frst) 


于 工 aj . 9./ 
一 六 x oot (DRCDacD 十 | S| 4(Dxr(D) 十 | 号 | Blt)u(lt) (5-30) 


于 是 ,问题 5-1 的 哈密 顿 - 雅 可 比方 程 为 


min (x QC + 707) RC uC) 
+ [| Ax D+ [| Bult) | 一 (5-31) 
由 于 wuQ) 无 约束 , 今 
RO HB E00 
得 使 哈密 顿 蚂 数 为 最 小 的 控制 
wu (1) = —R- I) BT dE) (5-32) 
将 式 (5-32) 与 已 知 的 式 (5-11) 相 比 可 知 , 最 优 性 能 指标 应 取 
J xt) = 35x (P(x) (5-33) 
在 式 (5-33) 中 ,P() 是 对 称 的 ,x(z) 为 初 态 , 故 将 式 (5-33) 分 别 对 x(z) 及 z 取 偏 导数 ,可 得 
2 ED po)xl) (5-34) 
ExT) Pt) (5-35) 


将 式 (5-34) 代 入 式 (5-32), 得 
u(t)=—R GB' CPO rG) (5-36) 


将 式 (5-35) 和 式 (5-36) 代 人 式 (5-31), 经 整理 后 得 
Fx LP HP A AT PO) 


—PG)BOR (0B GP(G)+OG) jx()=0 (5-37) 
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因为 P(i) 满 足 黎 卡 提 方 程 (5-13) ,所 以 式 (5-37) 对 任何 X(t) 均 成 立 , 说 明 式 (5-11) 表 述 了 萨 


xz (1 满足 哈密 顿 - 雅 可 比方 程 。 
在 式 (5-33) 中 , 令 1 二 ty, 得 最 优 性 能 指标 的 边界 条 件 


J*[xCz)) tJ]= Fx (POD) (5-38) 
由 于 歼 卡 提 方 程 边界 条 件 (5-14) 成 立 , 即 PG) 二 FF， 于 是 式 (5-38) 可 写 为 
T° [x C7) 4] = 3 Fr) (5-39) 


它 正 好 是 性 能 指标 (5-10) 的 末 值 项 ,于 是 充分 性 得 证 ， 

在 式 (5-33) 中 , 取 二 to,xX(t) 二 x(to), 正 好 证 明了 定理 中 的 最 优 性 能 指标 表达 
式 (5-12) 成 立 。 

(2) 黎 卡 提 方 程 解 的 若干 性 质 

由 定理 5-1 可 知 ,问题 5-1 的 最 优 控制 是 状态 的 线性 反馈 形式 

u’ (1 一 一 下 (人 CE) (5-40) 
式 中 
K(1)=R (BG)PG) (5-41) 
为 反馈 增益 矩阵 。 由 于 式 (5-41) 中 和 矩阵 RG) 和 BG) 是 已 知 的 ， 因此 闭环 系统 的 性 质 取 决 
于 黎 卡 提 方 程 的 解 P(z) 。 

(D PC 是 唯一 的 。 因 为 P(i) 赴 黎 卡 提 方 程 (5-13) 在 末 值 条 件 (5-14) 下 的 解 , 而 方程 
(5-13) 实 质 上 是 nn 十 1)/2 个 非 线性 标量 微分 方程 组 , 当 和 矩阵 4(i)、 8 和民 (满足 定 
理 5-1 中 的 假设 条 件 时 ,根据 微分 方程 理论 中 解 的 存在 与 唯一 性 定理 知 ,在 区 间 [6,21 
上 ,P() 是 唯一 存在 的 ,所 以 P() 是 唯一 的 ， 

必 PQ) 是 对 称 的 。 

他 题 5-1 着 和 矩阵 P(t) 是 黎 卡 提 方 程 (5-13) 及 其 边界 条 件 (5-14) 的 唯一 解 , 则 必 为 
对 称 矩 阵 , 即 

P(t)=P' C4) (5-42) 

证 明 将 黎 卡 提 方 程 (5-13) 及 其 边界 条 件 (5-14) 取 转 置 , 可 得 

—P' CG)=ATGQ)PTG)+PTGQ)AG) 
—PT (BLRT GY BT PT UH) 十 OrTC) (5-43) 
以 及 
P(t/)=F" (5-44) 
由 定理 5-1 的 假设 条 件 知 
R()=R C(t), CC 一 OTC)， 大 一 FT 
于 是 , 式 (5-43) 及 式 (5-44) 可 写 为 
—P' (2)=Pi()AG) + ATOG)PTC) 
—P (WBOR BT PT OH) HOU) (5-45) 
P'(G)=F : (5-46) 

纪 较 式 (5-13)、 式 (5-14) 与 式 (5-45)、 式 (5-46) 可 见 ,P(2) 与 PT(4) 是 具有 同一 边界 条 

件 下 的 同一 矩阵 微分 方程 的 解 。 因 为 P() 是 唯一 的 , 故 式 (5-42) 必 然 成 立 ，。 
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(3) PL) 是 非 负 的 。 
命题 $-2 ”对 于 性 能 指标 (5-10) 


J=3x (Px 站 十 二 | [x QC tu RW) jd 


如 果 对 所 有 的 1:€ [to,ty] ,有 
F>0, 0Q(2) 之 0,， R(2)~>0 
则 对 于 任意 的 wuC) 和 和 相应 的 x() ,总 有 / 
JTLxzCt ,u(t), |=0 
证 明 ”在 命题 假设 条 件 下 ,二 次 型 函数 
7 xT Pr)20 
x 《it)CCDrCD) 之 0 
u (IRG)uG)>O 
从 而 对 任意 的 wtt) 和 相应 的 xG), 必 有 
J[xC) sul) ,tt 0, ViElLto,ty) 
命题 5-3 若 和 矩阵 PG) 是 获 卡 提 方 程 (5-13) 及 其 边界 条 件 (5-14) 的 唯一 解 , 则 其 在 
区 各 [ 上 ,ty 上 必 为 非 负 矩阵。 
证 明 由 命题 5-2 知 , 对 任意 w(t) 和 相应 x(), 有 
z Sx nu) tO0, VitE [to,ty| 
当 取 wu() 二 wu* (2) 时 ,上 述 命题 仍然 成 立 。 故 最 优 性 能 指标 


J*|x(t) ,= 二 x (DP (Dx) 0, Vt€E|io,ts) 


上 式 对 任意 x() 成 立 , 故 必 有 
Pl) 之 0, VtElLto,t] 
(3) 最 优 控 制 解 的 存在 性 与 唯一 性 
车 问题 5-1 有 最 优 控 制 解 ,该 解 必 满足 定理 5-1 的 结论 ,可 以 论证 ,该 解 是 存在 且 唯 一 的 。 
定理 5-2 对 于 最 优 调 节 表 问题 5-1, 夺 ti 有 限 , 则 式 (5-11) 给 出 的 最 优 控制 wu* (z) 存 
在 且 唯 一 。 
证 明 人 b 存在 性 :定理 5-1 给 出 的 最 优 控制 的 充分 必要 条 件 
8” (1)=—R (BCG)PG)xXG) 
由 于 PQ) 唯一 存在 , 故 w* (以) 存在 。 
@ 唯一 性 : 反 设 w* (4) 不 了 歇 一 , 令 wi G4) 和 wz (2) 均 为 最 优 控制 , 则 依 PG) 的 唯一 性 可 
到 
ur (t)=— R(t)B' (P(x) 
ui (t)=—~—R (GB (PCG) x(t) 
相应 的 财 环 状态 方程 (5-15) 为 
Xi (t)=[AGQ)—BGR GB POG) jx (1), xr (t0)=xo 
x2 (2)=[AC()—BOOR GB OPOG) xi (G4), xr (to0)= xo 
可 见 , 最 优 轨 线 x? (t) 和 xz (2) 是 同一 微分 方程 且 满 足 同样 初始 条 件 的 解 。 依 据 微 分 方程 
初 值 问题 解 的 唯一 性 ,显然 有 
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xr (t)=x2 (t), ViEltos,ty| 
从 而 必 有 
Uy (1) 一 下 > (£),， vy t:€|tosty | 
由 此 ,唯一 性 得 证 。 
例 5-1 已 知 一 阶 系 统 状 态 方 程 
i(1)=57(t) Tult), z(t0) =x 
性 能 指标 
J lt) toult) = | 到 - x*(t) + 2e ‘u(t) |dt 
试 求 最 优 控制 zx Om J * [Lzx(to) 
解 ” 由 题 意 ,4 二 二 > ,B=1,F= 0,QGD) 一 了 ei',R()=2e-, 
歼 卡 提 方 程 (5- 13) 及 其 边界 条 件 (5- 14) 可 写 为 
TO 一 w+ (tr) 一 0 
这 是 非 线 性 变 系 数 微 分 方程 ,可 进行 如 下 等 价 恋 换 。 


z(t) —e-zr(t) ， WU(t) —e-3 (#) 


则 有 
T(1) = te Yr ut) | 
于 是 ,等 价 状态 方程 
Z(t) =n() 
等 价 性 能 指标 
7 一 | [3 | dt 
等 价 黎 卡 提 方 程 
一 p() 一 一 PC) 十 广 ， 户 (tr) 一 0 
解 得 
b= 
可 以 算出 等 价 最 优 控制 
u(t)=—R- (BT BO LD) = — Se Fp ze) 
从 而 , 原 系 统 的 最 优 控制 为 
or (0) ed (4)=—3(1 er) (tHe) ir) 
因为 


u* (1 一 一 R-IBTCDJPCDOrCD 一 — ep zr) 
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故 有 
p(t)=e ‘p(t)= (1—e’s)(e’ te s) 
不 难 算 出 原 系 统 的 最 优 指 标 
J* [xto0), (to) |=x G0)P(to0) ro) 
—(]—e®s 7)(eo 十 ezo 1) rx’ (to) 

从 本 例 可 匈 : 对 于 有 限时 间 调 节 器 , 黎 卡 提 方 程 的 解 P() 是 时 变 和 矩阵, 因而 状态 反馈 
增益 阵 K(2) 二 R71(1)B' (4)P() 也 是 时 变 的 ,使 得 闭环 系统 的 实现 比较 困难 。 即 使 对 于 线 
性 定常 系统 ,性 能 指标 中 的 权 阵 为 常 阵 ,情况 也 是 如 此 .这 种 时 变 状 态 调节 器 ,将 使 系统 的 
结构 复 淋 化。 

例 5S-2 设 一 阶 系统 的 状态 方程 

T(t)=azr(t)+u(lt), 7X(0)= x 
性 能 指标 


J] 一 FrzdnD) 十 十 | [Tar: (+ru? Ce)] dz 
假定 ; /三 0,g9>0,r>0。 试 求 最 优 控制 w* (4), 并 对 结果 进行 分 析 。 
解 由 有 限时 间 调 节 器 的 结果 得 
(0 一 一 一 户 (D) 工 () 
式 中 pQ) 是 如 下 和 歼 卡 提 方 程 的 解 
p=—2ap(t) tip —q, pt/)=7 


对 上 式 积分 ,得 
B+at (Bp—a)Ye®e 


p(t)=r ] yop (5-47) 

式 中 

B= 二 十 ai 

y 一 /7 一 4 一 及 

Jr 一 4 十 6 
由 最 优 闭 环 系统 方程 
区 (ft) 二 [a— 志 p(t) lz ， (0) 一 0 

解 得 最 优 轨 线 


千 取 4 二 一 1 ,f= 二 0,ty 二 1,zxo 二 】] ,9 二 1 ,而 7 取 不 同 值 , 则 系统 的 状态 变量 X(t)、 控 制 
变量 u(t) 和 黎 卡 提 方 程 解 p(t) 的 变化 情况 如 图 5-1 所 示 。 由 图 可 见 ; 当 7 较 小 时 ,x(4) 能 
迅速 趋 于 等 值 ,而 当 7r 较 大 时 ,zx() 的 衰减 缓慢 ; 当 7 较 小 时 ,p() 在 整个 控制 时 间 区 间 内 
几乎 为 常 值 , 仅 在 接近 末 值 的 一 段 时 间 内 才 表 现 出 时 变 特 性 ,而 当 值 较 大 时 ,p04) 随 时 
间 有 显著 变化 ; 当 7 值 较 小 时 ,wu(z) 在 初始 时 刻 幅 值 很 大 ,如 果 +->0,u(z) 在 t=0 处 将 近似 

» 171。 


zr* CD 一 zuexp| 一 二 pr) | dr 


于 一 个 强 脉冲 。 


图 5-1 例 5-2 系统 响应 曲线 


(a=—1,/=0,t/—=1,7xo=1,g=1) 


若 取 4a 二 一 1,g 二 1,r7 二 1,f 二 0 或 f= 二 1, 而 红 i 取 不 同 值 , 则 歼 卡 提 方 程 解 如 (的 变化 
情况 如 图 5-2 所 示 。 由 图 可 见 , 从 时 刻 起 ,p() 随 t 的 减 小 而 趋 于 一 个 “ 稳 态 值 ”; 随 着 tj 
的 增 大 ,p《) 保 持 常 值 的 时 间 区 间 也 随 之 增 大 ; 当 zy 相当 大 时 ,pG) 的 “ 稳 态 值 ” 与 边界 条 
件 无 关 。 


pn 
1.0 


0.5 
0 1 2 3 4 9 6 1 8 9 10 1 


图 5-2 例 5-2 系统 p() 变 化 情况 
事实 上 ,当红 趋 于 无 穷 时 , 式 (5-47) 的 极限 为 


lim p(t)=r(B+a)=ardr ,| 全 十 ai 
1r 一 5 


将 4 二 一 1,g= 二 =r 二] 代入 上 式 , 得 


lim p(t)=0.4]142 
上 一 6 
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由 此 可 见 , 只 要 取得 足够 大 ,可 将 p02) 视 为 常数 。 
5. 2.2 无 限时 间 状 态 调 书 兹 


有 限时 间 状 态 调节 器 只 考查 系统 由 任意 初 态 恢复 到 平衡 状态 的 行为 , 且 性 能 指标 只 
能 在 恢复 过 程 中 的 状态 偏差 ,控制 能 量 大 小 及 终端 误差 之 间 取 得 一 个 合理 折 中 。 然 而 , 实 
际 工程 问题 的 要 求 是 , 除 保证 有 限时 间 内 系统 对 非 零 初 态 的 响应 具有 最 优 性 外 ,还 要 求 系 
统 具 有 保持 平衡 状态 的 能 力 。 这 种 既 有 最 优 性 要 求 , 又 有 稳定 性 要 求 的 问题 只 能 用 无 限时 
间 调 节 器 理论 去 解决 。 

(1) 无 限时 间 时 变 状 态 调 节 器 

问题 $-2 设 线 性 时 变 系 统 状态 方程 为 

Et 一 4(Ct)XC) 十 如 (DEC ， xlto)=xo (5-48 ) 

性 能 指标 


1=3| [x (QOxC) Hu RW dt (5-49) 


式 中 回 量 xb w(t) 及 答 阵 4G)、BG)、OG)、RG) 的 假定 同 问 题 5-1, 控 制 u(i) 不 受 约束 。 
要 求 确定 最 优 控 制 u* (2) ,使 性 能 指标 (5-49) 极 小 。 

上 述 问 题 的 主要 结果 如 下 。 

定理 5-3 ”对 于 无 限时 间 时 变 状 态 调节 器 问题 5-2, 若 阵 对 (4(i) ,BG)}) 完 全 可 控 , 则 
存在 唯一 的 最 优 控制 


8 (1)=—R 1G)B' GPG)xr() (5-50) 
最 优 性 能 指标 为 
J = x (P(x) (5-51) 
式 中 
PU)= limP() (5-52) 
fr*oo 


是 对 称 、 非 负 的 ,而 PQ) 是 如 下 歼 卡 提 方 程 : 
—P()=PCQ)AG)T+A' GPC) 
—POG)BOOR (BT PYG) HQ) (5-53) 

及 其 边界 条 件 
P(t/)=0 (5-54) 
的 唯一 解 。 

证 明 本 定理 分 以 下 几 步 论证 。 

( 黎 卡 提 方 程 稳 态 解 B(z) 的 存在 性 。 设 初始 时 刻 为 1:。 因 系统 (5-48) 完 全 可 控 , 必 在 
在 有 限时 间 t>t 及 某 一 控制 uLt,tsj, 使 xCz;) 二 0。 作 区 间 延 拓 , 使 得 

ult,o0j=ult,t, j++ult, ,0) 

式 中 w[tz,00) 硅 0。 在 时 间 区 间 [t;,co] 上 取 堪 , 则 对 所 有 :EE ,ty ,控制 w[z,ty] 及 性 能 指 
标 JLx(z),u(。),t,tjj] 存 在 ,这 是 有 限时 间 状 态 调节 器 问题 。 由 定理 5-1, 已 证 w' [i,tyj 及 


J "Lx(4) ,t,t/] 存 在 , 故 其 相应 的 歼 卡 提 方 程 的 解 PG,1/)pP(4) 必 存在 ， 
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由 于 和 下列 二 次 型 晒 数 对 任意 x(i 有 界 


FxT (Pt) =.J"* [x (4) ,t,t/] 
SAD 
I{x) ult, 00 |,t, 0} 
=J (x) uli,t, |),t,t,) 
-一 ce 
故 抢 阵 P(z,ty) 必 有 界 , 且 其 上 界 与 ij 无关。 
设 w" [i,tyj 为 最 优 控 制 , 末 端 时 刻 tj 二 ty , 因 


Fx DP rH) = Lx) ts] 


tf 
一 | [xz (Cr)CCr)x(Cr) 十 Mr) 尼 Cr)aCr)] dr 


FXT DP ts EH) = Cx) ,sty,] 


ti» 
一 3| [x (Or x Cr) tu Cr RruCr) | dr 


考虑 到 Q() 宇 0,R() 二 0, 故 上 两 式 中 被 积 函 数 非 负 , 于 是 有 
x (PU,ts rEx (DP ,ty )x(t), V ts ity, 

从 而 ,P(z,ty) 为 单调 增 短 阵 函 数 .。 

由 “数学 分 析 ” 知 ,有 界 单调 增 旺 数 必 有 极限 , 故 式 (5-52) 成 立 , 稳 态 解 B(z) 存 在 。 

@ 稳 态 解 P() 满 足 黎 卡 提 方程 。 因 为 P(z,iy) 满 足 歼 卡 提 方 程 (5-53) 及 其 边界 条 
件 (5-54) ,根据 微分 方程 解 对 其 边界 条 件 的 连续 依赖 性 可 知 ,P(z,zy) 的 极限 解 瑟 (:) 必 满 
足 同 一 黎 卡 提 方 程 (5-53) 及 边界 条 件 (5-54) 。 

(3) 最 优 指标 及 最 优 控制 结论 。 设 某 一 控制 为 

u(t)——R iG)B' (PG)xG) (5-55) 
其 最 优 性 竺 证。 相应 的 性 能 指标 为 
TLx C2) OECD ,t,o0)= limJ [x(t) ,ult) ,t,t 


lim 六 | xT CQO HAR dr C5-56) 
4 一 co 


将 式 (5-55) 代 和 人 上 式 , 得 
JLx(t) ,u(t) ,t,o0) 


= lim 3| rr) [PO(BODR TBT TP) HOC) lxCr) dr 
to0 0 


一 一 jnm 二 | 车 jzlx (crD)PCrDxz(Cr)] dr 


一 TCD)FCDxzC) 一 二 lim xzTCtr) 互 (tr)x(tr) 之 0 (5-57) 
te oo 
在 式 (5-57) 中 ,因为 PGy) 宇 0, 所 以 
lim J[ x(t) ,u(t) tt JS x (PO x) (5-58) 
tie™oo 
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另 一 方面 ,由 于 2&() 尚 未 证 明 是 最 优 控制 , 故 由 有 限时 间 状 态 调 世 逢 绪 采 知 
J [XD m2) ,tt J Lx Ct) ,t,t 


=3xT (Px) (5-59) 
式 (5-59) 两 端 取 极限 , 计 及 式 (5-52), 可 得 
limy[xCD al) 25x P(x) (5-60) 
由 最 优 控制 的 唯一 性 定理 5-2 知 ,上 述 #() 必 为 最 优 控制 
uu” C=u0)=—R C0)B' GPG)xC) (5-61) 


至 此 ,本 定理 中 的 式 (5-50) 得 证 ;在 式 (5-59) 及 式 (5-60) 中 , 令 t==t, 则 式 (5-51) 得 
证 。 
天 于 定理 5-3, 有 如 下 几 点 注 记 。 
1) 定理 5-3 中 对 系统 提出 的 完全 可 控 性 要 求 , 是 为 了 保证 最 优 解 的 存在 。 在 有 限时 
间 调 节 器 问题 中 ,对 系统 并 无 可 控 性 要 求 , 因 为 积分 上 限 尹 有 限 , 无 论 系 统 可 控 与 否 , 性 
能 指标 J 不 会 趋 于 无 穷 ,即使 不 可 控 且 不 稳定 状态 变量 包含 在 性 能 指标 中 时 也 是 如 此 。 
硅 tj/ 习 co, 当 不 可 控 状态 不 稳定 , 且 又 包含 于 J 之 中 时 , 便 会 使 J->oo, 从 而 使 u* (2) 不 存 
在 。 试 看 下 例 ， 
例 5-3 设 系 统 状态 方程 及 初始 条 件 为 
z(t)=zx(t), zi1(0)=1 
zalt)=zx 0) +ult), rs(0)=0 
性 能 指标 
7J= 卫 | [xT Or) twee)] dt 


试 求 最 优 控制 & (2) 及 最 优 性 能 指标 J*，。 
解 人 状态 zi1(2) 不 可 控 。 本 例 为 线性 定常 系统 ,其 可 控 性 判 据 


0 0 
rank|b Ab]=rank| ， < 


故 系 统 不 可 控 。 由 给 定 的 状态 方程 明显 可 见 ,状态 z1(t) 是 不 可 控 的 。 
区 不 可 控 状 态 zi (0) 不 稳定 。 从 某 种 意义 而 言 ,考虑 取 u(t)=0, 也 许可 使 了 极 小 。 此 


时 ,系统 矩阵 
-| 1 
状态 转移 矩阵 
= 74]=| 央 
故 系 统 的 零 输 入 响应 为 
ol] 
显然 
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limzl (bo 一 hme' 一 oo 
@) 不 稳定 且 不 可 控 状 态 x1(t) 包 含 于 性 能 指标 之 中 。 当 取 x (一 0 时 ,性 能 指标 
= 地 | x (t)x(t) dG) 一 二 | [CD 十 地 CO] di 一 > Co (5-62) 


因而 本 例 不 存在 使 了 二 min 的 最 优 控制 & G4)，。 

实际 上 ,本 例 为 线性 定 第 系统 ,性 能 指标 中 的 权 和 矩阵 亦 为 常 阵 , 因 此 ,即使 对 于 无 限时 
间 定 荔 状 态 调 节 闽 问题 ,为 了 保证 最 优 解 存在 ,也 必须 要 求 系统 完全 可 控 。 

2) 对 于 无 限时 间 状 态 调 节 散 ,通常 在 性 能 指标 中 不 考虑 终点 指标 , 取 权 阵 下 一 0。 其 
原因 有 二 :一 是 希望 :一 co 时 ,xir) = 二 0, 即 要 求 稳 态 误差 为 零 ,因而 性 能 指标 中 不 必 加 入 
体现 终点 指标 的 未 值 项 ;二 是 工程 上 仅 考 虑 在 有 限时 间 内 系统 的 响应 ,因而 :一 co 时 的 终 
点 指标 将 失去 工程 意义 ， | | 

3) 对 于 无 限时 间 时 变 状 态 调 市 器 ,由 于 歼 卡 提 方 程 (5-53) 在 边界 条 件 (5-54) 下 的 稳 
态 解 (4) 仍 然 为 时 变 和 矩阵 ,因而 最 优 控 制 律 是 时 变 的 ,不 便于 工程 应 用 。 

(2) 无 限时 间 和 定常 状态 调节 器 

问题 S-3 设 线 性 定常 系统 状态 方程 

X(t)=—=Ax(t)+Bult), x(0)=xo (5-63) 


性 能 指标 
=3| [x )QxC) tu Ce) Ru dt (5-64) 


式 中 x(2) ER" ;u(t) ER", 且 无 约束 ;4、B.0 和 RR 是 维 数 适当 的 常数 矩阵,。 并且 ,QO 和 丸 分 
别 为 非 负 定 和 正定 对 称 和 矩阵 。 要 求 确定 最 优 控 制 w* (4) ,使 性 能 指标 (5-64) 极 小 。 

问题 5-3 与 问题 5-2 的 区 别 是 系统 的 系数 矩阵 及 性 能 指标 中 的 权 阵 均 为 常数 矩阵 。 
可 以 证 明 , 如 果 满 足 可 观 性 条 件 , 则 与 问题 5-3 相应 的 黎 卡 提 方 程 的 解 互 为 对 称 正 定常 
阵 ,从 而 构成 线性 定常 状态 反馈 ,便于 工程 实现 。 

定理 5-4 对 于 系统 (5-63) 和 性 能 指标 (5-64) ,车 对 于 任意 矩阵 D, 有 DD 一 0, 且 PP 
是 如 下 黎 卡 提 和 矩阵 代数 方程 ， 

PA+A'™P—PBR-'B'P+O=0 (5-65) 

的 解 , 则 阵 对 {4,D}) 完 全 可 观 的 充分 必要 条 件 是 P 为 对 称 正定 矩阵 。 

证 明 矩阵 疡 的 对 称 性 是 显然 的 。 现 仅 证 互 正 定 的 充分 必要 条 件 。 

必要 性 : 反 设 {4,D} 可 观 ,但 P 非 正定 。 对 于 性 能 指标 (5-64), 由 于 0 宇 0,R>>0, 故 对 
于 任意 wuw(), 必 有 J/ 宇 0。 因 为 问题 5-3 是 问题 5-2 的 特例 , 故 有 


-也 [x Ox Fu’ TO) Ru () Jdt= 5x Pxo>0， VY xzo 天 0 (5-66) 


由 于 P 非 正 定 , 取 P 之 0, 则 由 式 (5-64) 中 被 积 函 数 的 非 负 性 可 知 , 应 取 w() 二 0。 于 是 , 式 
(5-63) 的 解 为 如 下 形式 的 零 输入 响应 


XxX(f) —@ “xo 


本 到 | x (1)Qx(t)dt= | xle4 ‘DDTe*xodt=0 (5-67) 
0 0 


D ex 一 0， YY xoA0 (5-68 ) 
由 线性 系统 理论 知 , 式 (5-68) 表 示 D'e* 列 相关 ,也 即 {4,D} 不 可 观 ,与 假设 了 乌 盾 。 故 反 设 
不 成 立 , 必 要 性 得 证 。 
充分 性 : 反 设 PP 正定, 但 {4,D} 不 可 控 。 此 时 有 式 (5-68) 成 立 。 不 失 一 般 性 , 取 w(t)= 
0, 则 性 能 指标 式 (5-67) 成 立 。 
因为 广 委 /于 是 有 ,. 广 委 0。 考 虑 到 . 广 是 非 负 的 ,应 有 


.一 5x8 Px=0, VY Yo 天 0 


于 是 有 P 之 0 与 假设 矛盾 。 故 反 设 不 成 立 ,充分 性 得 证 。 

上 述 定理 ,主要 作为 论证 无 限时 间 定 常 状 态 调节 器 结论 的 引 理 。 

定理 $5-5 对 于 无 限时 间 定 常 状 态 调节 器 问题 5-3, 若 阵 对 {4,B} 完 全 可 控 , 阵 对 {4， 
D}; 完 全 可 观 ,其 中 DD =Q, 且 也 任意 , 则 存在 唯一 的 最 优 控制 


u* (1)=—R-!'B'Px(t) (5-69) 
最 优 性 能 指标 为 
J = Px (5-70) 
式 中 PP 为 对 称 正定 常 阵 ,是 下 列 黎 卡 提 和 矩阵 代数 方程 的 唯一 解 
PA+A'™P—PBR 'B'P+O=0 (5-71) 


证 明 和 矩 阵 P 了 的 对 称 性 及 唯一 性 是 显然 的 。 因 为 {4,D} 可 观 , 由 定理 5-4 知 ,P 必 为 

正定 矩阵 。 下 面 证 明 
P=— lmP( ,£7) (5-72) 
tr?oo 

为 常 阵 。 

因为 {4,B} 可 控 , 由 定理 5-3 知 , 式 (5-72) 存 在 。 由 于 系统 (5-63) 定 常 ,初始 时 刻 可 以 
任 定 ,所 以 有 

P=limP(,t)= lim PG,t)= 1limP(0,t~—t)= lim P(0,t/—1) 
if™oo ‘f° if™o i 

上 式 表 明 ,P 与 起 点 无 关 , 仅 与 时 间 间 隔 i/ 一 i 有 关 , 这 正 是 常 阵 性 质 的 体现 。 因此 , 必 有 


P=0。 于 是 定理 5-3 中 的 黎 卡 提 方 程 (5-53) 演 化 为 黎 卡 提 方 程 (5_71)。 
由 于 定理 5-3 的 结论 适用 于 问题 5-3, 若 令 互 代 换 定理 5-3 中 的 (4), 则 本 定理 结论 
中 的 式 (5-69) 和 式 (5-70) 自然 得 证 。 


5. 2.3 最 优 调 书 系统 的 渐 近 稳定 性 
按 定 常 调 节 器 问题 进行 综合 ,可 得 最 优 调节 系统 ,其 闭环 系统 方程 为 


(1)= (A—BR BP)xX(G), x(0)=xo (5-73) 
由 于 稳定 是 系统 能 够 正常 运行 的 首要 条 件 , 因 此 需要 研究 最 优 调节 系统 (5-73) 淅 近 稳定 
的 必要 条 件 。 
定理 $-6 设 线性 定常 系统 
(t)=Ax(t)TBuli), x(0)=x,o (5-74) 


性 能 指标 
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=3| [xzrCDOOxrG) 二 TCDRudz) Jdt (5-75) 


式 中 x() ER";u(t)E€R”, 且 无 约束 ;和 矩阵 4、B8.0Q 和 R 是 维 数 适当 的 常 了 泗 , 且 QQ 和 RR 分别 
为 非 负 定 和 正定 对 称 矩 阵 。 厂 阵 对 {4,B} 完 全 可 控 , 阵 对 {4,D)}) 完 全 可 观 , 其 中 DD' 一 9， 
而 DD 任意 , 则 闭环 系统 
X00)=(4—BR BP)xX(), x(0)=xo (5-76) 
为 渐 近 稳定 的 最 优 调节 系统 ,x (zi)Px (4) 为 一 个 李 雅 普 诺 夫 函 数 。 其 中 ,P 为 对 称 正定 常 
阵 , 古 黎 卡 提 抢 阵 代 数 方程 (5-71) 的 唯一 解 。 
证 明 因 {4,B8) 可 控 ,{4,D} 可 观 , 由 定理 5-5 知 ,唯一 的 最 优 控制 为 
u* (1)=—R-1B'Px() (5-77) 
式 中 PP 为 对 称 正定 常 阵 , 且 满足 式 (5-71)。 
将 式 (5-77) 代 入 式 (5-74), 立 即 可 得 式 (5-76)。 因 为 式 (5-77) 为 最 优 控 制 , 故 闭 环 系 
统 (5-76) 为 最 优 调节 系统 ，。 
取 二 次 型 也 数 
V(x)=x’ ()Pxr() (5-78) 
式 (5- 78) 仅 当 x 一 0 时 , 才 有 YGxr) 一 0; 对 于 非 零 x, 由 于 尼 >0, 必 有 TY(zr) 盖 0。 故 式 (5-78) 
为 李 雅 普 诺 夫 函数 。 显 然 
im Go 一 lim xX (Px) 一 co 
成 立 。 取 式 (5-78) 对 时 间 z 的 导数 ,得 
Vx)=x' (t)Px C(t) xr (PX) 
将 式 (5-74) 和 式 (5-71) 代 人 上 式 , 可 进一步 化 为 
V (x)=x' (1) (AT—PBR BT)P+P(A— BR BThP) Jx(t) 


=—x GQO+PBR BP x(t) (5-79) 
因为 @ 非 负 ,R 正定 , 必 有 [QQ 十 PBR-18TP] 宇 0。 由 式 (5-79) 可 得 
V (x) 志 0 
肥 设 对 于 非 零 x(0) 有 V(x) 寺 0, 则 由 式 (5-79) 知 ,应 有 
x' (tOx(t)=0 (5-80) 
x'(t)PBR-'BT™Px(t)=0 (5-81) 


因为 u* () 二 一 R 'B'Px(t), 所 以 式 (5-81) 可 表示 为 
u’ (1)Ru* (1)=0 
由 于 R 二 0, 故 应 有 w"* (1) 寺 0。 因 此 ,系统 (5-74) 的 零 输 入 响应 为 
. X(L) =e x(0), VY x0)AA0 (5-82) 
将 式 (5-82) 代 人 式 (5-80) ,可 得 
xzTC0)e4 ‘DDTe*x(0)=0 
上 式 表 明 
De*x(0)=0, YY(O) 天 0 
这 枉 {44, 忆 } 可 观 假设 矛盾 , 反 设 不 成 立 。 从 而 
VO)¥0, Vx(0) 尖 0 
根据 李 雅 普 诺 夫 稳定 性 定理 ,系统 (5-76) 大 范围 渐 近 稳定 。 
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应 当 指 出 ,在 定理 5-6 中 ,要 求 {4,8}) 可 控 , 是 为 了 保证 最 优 解 存在 ;要 求 14,D}) 可 
观 , 是 为 了 保证 最 优 调节 系统 渐 近 稳定 。 如 果 {4,D} 不 可 观 , 只 要 满足 其 他 特定 条 件 , 最 优 
调节 系统 也 可 以 渐 近 稳定 。 请 读者 自行 论证 以 下 命题 。 
命题 $5-4 ”对 于 系统 (5-74) 和 性 能 指标 (5-75), 已 知 阵 对 {4,B} 可 控 , 且 系统 (5-74) 
的 可 控 标准 形 为 
r=[ ot he x(0)=x, 
趟 中 {411,B1) 为 可 控 对 。 假 定 {4,D} 不 可 观 , 其 中 DD' 一 0,D'==[0,DEb]， 
如 果 4;; 的 特征 值 全 部 具有 负 实 部 , 则 最 优 闭环 系统 是 浙 近 稳定 的 。 
例 S-4 设 系统 状态 方程 : 
Z1(t)—ult), Xi1(0)=0 
tslt)=x(t), za(0)=1 
性 能 指标 


=| [z+ ld 


试 求 最 优 控 制 w* () 和 最 优 指标 7" 。 
解 本 例 为 无 限时 间 状 态 调 节 器 问题 。 由 题 意 


4=1 由 |， oo- 
“L104.” Lo < Lo 14 


令 DD' 一 Q, 得 D' 一 [0 1j。 显然,{4,5} 可 控 ,{4,D} 可 观 , 故 u* (存在 且 唯 一 ,最 优 闭 
环 系统 渐 近 稳定 。 


今 


“S| 


__ 网 | 
， Piz PpP2s 
代 人 和 歼 卡 提 方 程 (5-71) ,并 代入 相应 的 4.5.0 和 +, 解 得 
1 工 

_ 2 2 
p= 
了 1 
显然 有 尼 >0。 于 是 ,最 优 控制 

u” (D) =—Tb'Pxr()=—27 (1) — 27x,(t) 


最 优 指 标 
J*=x' (0)Px(0)=]1 

最 优 闭 环 系统 

1 


_ 一 2 一 2 
xD 一 | 4 一 二 2807F| CO 一 | | 
7 0 0 


不 难 求 得 其 特征 值 为 Ai 一 一 1] 十 ],As 二 一 1 一 ]j。 由 特征 值 判 据 知 ,闭环 系统 渐 近 稳定 。 
例 5-5 已 知 系统 状态 方程 
。 1]79 。 


XZ1(t) = z(t) 
Z(t) =u(lt) 
性 能 指标 
7 一 二 | [xf (0) +2br C0) rl) +azi(t) tu lt) dt 


式 中 a 一 多 >>0。 试 求 最 优 控制 ww“ 以 )。 
解 ” 本 例 为 无 限时 间 定 常 状态 调节 器 问题 。 由 题 意 知 


eb 


容易 验证 {4,5} 可 控 , 故 w* (0 存在 且 唯 一 。 令 
p- [eA] 
Pi? P22 
将 P.4.b、r.8 代入 歼 卡 提 代 数 方 程 (5-71), 可 得 如 下 代数 方程 组 
zi 一 1 一 0 
pnri™— pp tb=0 
2p1s— pizscta=0 
解 得 
pu=pipzz—b, pwz= 十 ]， pz= 士 NV a 二 2p 


为 了 保证 最 优 财 环 系统 渐 近 稳定 ,要 求 忆 >0, 从 而 应 有 
pu>0, pupzs— pis>0 


上 述 不 每 式 成 立 的 必要 条 件 是 pz 盖 0, 故 取 pzz—=N a2pi。 
试 取 pi 一 一 1 得 PP22 ~ 4 一 2, 必 有 4a>2, 从 而 Pl 三 一 Va—2 一 5 之 0; 应 取 b= 


一 Ya 一 2 二 0. 于 是 由 pupzzs— piz>0 得 
—(a—2)—6b va—2>1 


即 
+ uD 1 2 ~—b Va—2> (a—1) 
| 由 于 2<0,a 盖 2, 故 上 述 不 等 式 两 边 都 是 正 
Nd (站 让 
p> ~、 
(a) 2& 一 2 
0 + ul?) | 2 上 式 卫 ab 全 0 的 已 知 条 件 币 导 。 于 是 应 取 


~ pu 二 1, 解 得 
5- ! > 
Vo ] Vat2 
机 本 例 最 优 控制 应 为 


图 5-3 最 优 系统 结构 图 


180 ， 


or (0) = bPxrt) ox) — VaF2r,() 


y 


最 优 系统 结构 图 如 图 5-3 所 示 。 
5.3 有 具有 给 定 稳 定 度 的 状态 调节 琵 


对 于 无 限时 间 征 稼 状态 调节 器 问题 ,只 要 系统 {4, 有 ) 可 控 ,{4, 刀 )} 可 观 ,所 求 得 的 党 
量 线性 状态 反馈 控制 律 , 不 但 可 以 使 系统 获得 最 优 性 ,而 且 可 以 使 最 优 调节 系统 渐 近 稳 
定 。 然 而 ,从 工程 实用 观点 来 看 ,我 们 还 希望 最 优 调节 系统 的 特征 值 位 于 复 平面 的 一 定 区 
域内 ,例如 ,在 :平面 上 特征 值 位 于 Res 二 一 a,a>0 左 侧 的 那 部 分 区 域 . 这 样 , 渐 近 稳定 的 
最 优 调 三 系统 可 以 具备 预定 的 动态 性 能 。 

本 节 介 绍 如 何 适当 修改 性 能 指标 ,对 于 无 限时 间 定 常 状 态 调节 器 求 出 一 个 定常 控制 
. 律 ,使 修改 后 的 性 能 指标 极 小 ,并 使 渐 近 稳定 的 闭环 系统 具有 至 少 为 a 的 稳定 度 。 这 样 的 
无 限时 间 定 芝 调 节 辫 问题 , 称 为 具有 给 定 稳定 度 的 状态 调节 器 问题 。 

问题 5$-4” 设 线性 定常 系统 状态 方程 

X(t)=Axr()+Bul), rx(0)=xr, (5-83) 

性 能 指标 


J 一 六 | er [x (Ox ur) Rad) Jdt (5-84) 


式 中 x(1)E€ R";u(t) ER”, 且 无 约束 ;4、B8.0 和 RR 是 维 数 适当 的 常数 矩阵 ,。 并且,QO 和 RR 分 
别 为 非 负 定 和 正定 对 称 和 矩阵 。x>0, 为 已 知 值 。 要 求 确定 最 优 控制 wu" (z), 使 性 能 指标 
(5-84) 极 小 ,并 使 最 优 闭环 系统 渐 近 稳定 ,其 特征 值 实 部 小 于 一 a。 

比较 问题 5-4 与 问题 5-3 可 知 , 除 性 能 指标 中 多 了 一 项 e*# 因 子 外 ,其 余 完全 相同 。 如 
打通 过 线性 变换 ,将 问题 5-4 化 为 问题 5-3 的 等 价 形式 , 则 定理 5-5 和 定理 5-6 的 结论 将 
适用 于 求解 问题 5-4。 这 种 等 价 问题 , 称 为 修正 调节 器 问题 . 


5. 3. 1 修正 调节 器 问题 的 最 优 解 


设 在 问题 5-4 中 ,{4, 好 完全 可 控 ,{4,D) 完 全 可 观 ,其 中 万 为 任 一 使 DD7=0 的 乱 
阵 。 可 控 及 可 观 的 要 求 , 对 确保 无 限时 间 问 题 有 解 以 及 确定 对 闭环 系统 的 稳定 度 约束 是 必 


需 的 。 
通过 变换 方法 ,可 将 问题 5-4 化 为 无 限时 间 定 常 调 节 器 问题 。 定 义 
XxX(1)=e”x() (5-85) 
u(t) =e"u(t) (5-86) 
考查 

Y(t) =ae<x() Terr) =at(t) Te Ar) eBucs) (5-87) 

将 式 (5-85) 和 式 (5-86) 代 入 上 式 ,得 修正 调节 器 状态 方程 
X(t) = AFaDi) + Ba), (0)=x(0) (5-88) 


将 式 (5-85) 和 式 (5-86) 代 入 式 (5-84), 得 修正 调节 器 性 能 指标 
18] * 


j=3| [ET QF) ti REG) Jdt (5-89) 


式 中 8 与 RR 仍然 分 别 为 非 负 和 正定 对 称 和 矩阵 。 

对 于 系统 (5-88) 和 性 能 指标 (5-89) ,如果 没有 可 控 性 和 稳定 性 的 附加 约束 , 则 这 一 最 
小 化 问题 可 能 无 解 . 显然 ,使 修正 调节 器 问题 最 优 解 存在 的 约束 条 件 是 {4 十 a1,B} 完 全 可 
控 ;使 团 环 系 统 渐 近 稳定 的 约束 条 件 是 {4 十 a1,D} 完 全 可 观 。 

根据 线性 系统 理论 不 难 证 明 , 如 下 四 种 提 法 完全 等 价 ， 

CO {4,B} 是 完全 可 控 的 。 

(2) 对 于 定常 同 量 w 和 所 有 的 1,w e* 二 0 意味 着 w= 二 0。 

(3) 对 于 定常 癌 量 w 和 所 有 的 1,w e”e*B 一 WwW e“+* YB 一 0 意味 着 w= 二 0。 

4) {4 十 aI,B) 是 完全 可 控 的 。 
由 于 已 设 {4,B}) 完 全 可 控 , 因 此 {4 十 al,B} 完 全 可 控 , 根 据 对 偶 性 原理 , {4,D} 完 全 可 观 等 
价 于 {和 十 aI ,DD 完全 可 观 ， 

根据 定理 5-5, 修 正 调节 器 问题 存在 唯一 的 最 优 控制 


uu’ (1)——R BPr() = — Kx(t) (5-90) 
最 优 性 能 指标 
j= (0)Pr(0) (5-91) 
式 中 忆 为 正定 对 称 常 阵 ,满足 下 列 歼 卡 提 和 矩阵 代数 方程 
P(A+al)+(A'+al)P—PBR BP+O=0 (5-92) 
根据 定理 5-6, 最 优 闭环 系统 | 
x=(A+al—BR- BPR(), x(0)=x(0) (5-93) 
是 渐 近 稳定 的 。 


求 得 修正 调节 器 问题 的 最 优 解 以 后 ,需要 转换 到 原来 的 调节 器 问题 之 中 ,以 便 获得 要 
求 的 结果 。 


5.3.2 具有 给 定 稳定 度 的 调节 器 问题 的 最 优 解 
将 式 (5-85) 各 式 (5-86) 分 别 代 入 式 (5-90)、 式 (5-91), 式 (5-93), 可 得 最 优 控制 


PH (4)=e*u’ (4)=—R-1B'Px() (5-94) 

最 优 性 能 指标 
J = exT (to) Px Co) =5x"(0)Px(0) (5-95) 

最 优 闭 环 系 统 
X(t1)=(A—BR- BP)xXG), x(0)=x, (5-96) 


渐 近 稳定 。 其 中 P 满足 式 (5-92)。 
为 了 证 明 关 于 稳定 度 的 规定 ,由 渐 近 稳定 的 式 (5-93) ,有 
limx(z) =—0 (5-97) 
将 式 (5-85) 代 入 式 (5-97), 可 得 
lime™x(z) 一 0 (5-98) 
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因此 , 当 上 >~co 时 ,最 优 闭 环 系统 (5-96) 的 状态 x(G) 至 少 以 e “的 速度 趋 于 零 ,完全 满足 给 
定 稳定 度 a 的 要 求 。a 越 大 ,x() 收 于 等 的 速度 越 快 . 通常 ,将 a 称 为 闭环 系统 的 最 小 稳定 
度 。 
为 了 便于 应 用 ,将 以 上 结果 归纳 为 如 下 定理 。 
定理 5-7 设 线性 定常 系统 状态 方程 
X41)=AxCG)+Bud), x()=xo (5-99) 
性 能 指标 


=| Ce [xT CQxC) Fu Rul) Jd z (5-100) 


式 中 x(1)E R" ;u(t)E R", 且 无 约束 ;A、8.、Q、R 为 维 数 适当 的 常 阵 ,和 目 Q 和 RR 分 别 为 非 负 
和 正定 对 称 和 抢 阵 ;ea 为 给 定 的 正常 数 。 

右 阵 对 {4,B8}) 完 全 可 控 , 阵 对 {4,D}) 完 全 可 观 ， 其 中 帮 为 任 一 一 使 DD' 二 0 的 矩阵 , 则 
存在 唯一 最 优 控 制 


u’ (1)——R-'B'™Px() (5-101) 
最 优 性 能 指标 
J = exT (to) Px Ct,) (5-102) 
式 中 P 为 正定 对 称 常 阵 , 是 下 列 黎 卡 提 代 数 方 程 ， 
P(A+aD)+i+(A'+aDP—PBR BTP+O=0 (5-103) 
的 唯一 解 。 最 优 闭环 系统 ] 
X(t)—= (A—BR BP)xX(), x(t)=x (5-104) 


是 浙 近 稳定 的 , 且 稳 定 度 至 少 为 a。 
例 5-6 设 角 度 控制 系统 方程 为 : 
J = MG) (5-105 ) 
式 中 0(2) 为 角 位 称 ,M(z) 为 外 加 转 矩 ,J 为 旋转 部 分 的 转动 惯量 ,假定 Jo 一 1。 要 求 确定 最 
优 外 加 转 矩 M" (1) ,使 系统 能 量 消耗 与 角 位 移 相 对 于 原平 衡 位 置 的 仿 差 综合 最 小 ,并 保 
证 最 优 闭环 系统 至 少 有 a=1 的 稳定 度 。 
解 令 z=0) ,zat)=0) ut) = = MQ), 可 写 出 系统 的 状态 方程 及 性 能 指标 罗 


0 
:=| ro 二 | ue 
0 0 1 


T=| ext + de 
这 是 具有 给 定 稳定 度 要 求 的 无 限时 间 定 常 状态 调节 器 问题 ， 按 题 意 


-ly ol 0b], 0-[, 0 
0 0 9 本 1 9 OC= 0 0 9 一] ,aa 一] 


0 
rankib Ab]=rank| ， | 一 2 


因为 


D! 1 0 
rank | | 一 Yank | 一 2 
D'A 0 1 


式 中 DD 一 0,D = 二 [1 0j,; 因 此 {4,b}) 可 控 ,{4,D}) 可 观 , 所 求 最 优 控 制 必 存在 , 且 最 优 闭 


环 系统 可 具有 要 求 的 稳定 度 
令 

-12 Pr 
{= 网 | 

由 黎 卡 提 代 数 方程 (5-103) ,得 如 下 代数 方程 组 
2pu—pis+1=0 
put2piz— pipzz=0 
2p1z2+2pzs™— p22—=0 

解 得 


pn=10.1329, ps~=4.6116, po 一 4.1974 
最 优 控 制 律 
7 () =— Tb"Bxr() = — pur (£) — pzzr2 (t) 


即 
Af (1)=~—4.61160(1)—4.19740() 
这 一 控制 律 可 用 比例 加 微分 反馈 来 实现 。 由 式 (5-104) 得 最 优 闭 环 系统 方程 


0 
or | 
一 4.6116 一 4.1974 


xt) 
其 特征 方程 


A 十 4. 19744 十 4.6116 二 0 
解 得 特征 根 4,== 一 2.1 土 i0. 46 ,表明 闭 环 系统 渐 近 稳定 并 满足 要 求 的 稳定 度 。 


5. 4 逆 最 优 调节 器 


逆 最 优 再 世 囊 问题 ,是 指 已 知 某 个 具有 未 知 定常 扰动 的 线性 定常 系统 ,在 规定 稳定 度 
要 求人 ,寻求 某 个 二 次 型 性 能 指标 ,使 得 由 规定 稳定 度 要 求 确定 的 线性 状态 反馈 控制 律 
ult) 二 Kx(t), 对 所 构造 的 性 能 指标 来 说 是 最 优 的 。 因 此 , 道 最 优 调节 器 问题 的 实质 ,是 最 
优 瑞 三 作 的 极点 配置 问题 。 这 里 研究 的 极点 配置 区 域 , 指 在 s 左 半 平 面 ,以 从 原点 引出 的 
两 条 性 负 实 轴 形成 土 9 夹 角 的 直线 为 界 , 所 形成 的 扇形 区 域 。 当 最 优 调节 器 的 闭环 极点 位 
于 指定 的 局 形 区 域内 时 ,对 最 优 调节 器 状态 响应 的 收敛 速度 和 阻尼 程度 都 有 所 规范 ;而 当 
最 优 凋 节 器 的 团 环 极点 位 于 上 节 所 述 * 左 半 平 面 一 a 垂 线 之 左 时 ,只 能 对 最 优 调节 器 状 
态 啊 应 的 收敛 速度 有 所 规范 。 : 

本 市 讨论 如 何 用 李 雅 普 诺 夫 第 二 法 来 确定 满足 给 定 稳定 度 约束 下 的 状态 反馈 阵 外， 
并 证 明 ; 对 任意 实 和 矩阵 KK, 当 R 取 为 单位 阵 时 ,0 必定 满足 非 负 条 件 。 
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5. 4.1 逆 调节 琵 问 题 


设 完全 可 控 系 统 状 态 方程 
x(1)=Az() Balt) Ew (5-106) 
式 中 x(1) 为 n 维 状 态 向 量 ;wu(2) 为 m 维 控制 向 量 , 昌 匹 约束 ;w 为 m 维 常 值 未 知 扰动 向 
量 ;m<n;A、B 和 E 为 维 数 适当 的 常数 矩阵 。 假设: 
GD 矩阵 名 列 满 秩 。 / 
加 值 域 空间 RR(E)CCR(B)， 
(3 规定 稳定 度 要 求 >0,0 扫 p 一 1。 


知 令 
z(t)=u(t) iw (5-107) 
w= Miw (5-108) 
则 逆 最 优 调节 化 问题 为 :寻求 二 次 型 性 能 指标 
J 一 | ex[x" (OFLC) FzT 0 Rezd) FuT)S nt) Jdt (5-109) 


使 得 由 a 和 8B 确定 的 控制 律 &(G ,对 性 能 指标 (5-109) 是 最 优 的 。 其 中 ,0 为 非 负 对 称 常 
阵 ,R 和 5S 为 正定 对 称 常 阵 . 
由 假设 已 ,能 够 选取 一 个 矩阵 M, ,使 得 


E= BM, (5-110) 
将 式 (5-110) 代 入 状态 方程 (5-106) ,并 考虑 式 (5-107) 和 式 (5-108) ,可 得 
x(1) At) + Bz) (5-111) 
至 于 在 性 能 指标 (5-109) 中 增加 控制 的 导数 项 a7 00$ (a ,是 为 了 在 稳 态 时 抵消 系统 输入 
癌 的 常 值 未 知 扰 动 对 系统 性 能 的 影响 。 
定义 
u(t)=u() =20) : (5-112) 
z xD 一 | (5-113) 
ZL ) 
则 系统 方程 (5-111) 和 (5-112) ,以 及 性 能 指标 (5-109) 可 以 写 为 
X(t) =Axr() + Buli) (5-114) 
J= | ,ex [xT (2)Qx 2) FuT (Rul) di (5-115) 
式 中 


和 [es 


显然 ,4、B.Q 和 民 均 为 维 数 适当 的 常 阵 , 且 Q@ 和 尽 分 别 为 非 负 和 正定 对 称 和 矩阵 ， 

经 上 述 算 阵 增 广 后 , 逆 最 优 调节 器 问题 转化 为 :对 于 给 定 的 线性 定常 系统 (5-114) 和 
给 定 稳 定 度 约束 a 和 8, 寻求 状态 反馈 阵 六 和 权 阵 8 与 R, 使 得 ult) 二 Kx(t) 满 足 a 和 8B 
约束 成 为 最 优 控制 ,并 使 性 能 指标 (5-115) 极 小 。 


上 


5.4.2 状态 反馈 阵 的 表达 式 


一 个 完全 可 控 的 nn 阶 连续 系统 ,对 其 给 定 稳定 度 的 一 种 评价 规则 是 所 有 闭环 极点 的 
实 部 和 幅 角 有 要 求 的 上 限 。 寿 用 5S; 表示 期 望 极点 区 域 , 易 见 S, 为 图 5-4 中 的 阴影 区 。 


引 理 5-1 定常 齐 次 动态 方程 
X(t) = Ax(i) 


I 其 零 解 渐 近 稳定 的 充 要 条 件 是 :对 给 定 的 
任 一 个 正定 对 称 阵 N, 都 存在 唯一 的 正定 


pa 、 oy 0 = arcsinB 对 称 阵 MM ,使 得 
/ ‘De : ATM+MA=—N 
a 2 RC 引 理 5-2 ”对 于 完全 可 控 的 nn 阶 连续 


系统 
a X(t) = Ax(t) Bult) 


如 果 
必 有 A(A)ES,,T=],2,..*,n,Eh 
ou ， 
1 一 C 
AI<i 5， 1 一 ] Le ,nNn 


式 中 A(，。) 表 示 特 征 值 ,Re(。) 表 示 实 部 。 
引 理 5-3 ”对 于 任意 给 定 的 nxn 正定 对 称 矩 阵 NN, 以 及 任意 正 数 a 和 8(0 雪 8 一 1)， 


矩阵 方程 
| 214 7 | w+a 2 A+i<3! |=-N (5-116) 
EE 
A < ;一 1,2， 


定理 5-8 A y_ 关 加 为 正定 对 靳 类 了 
必 存 在 满足 下 式 的 状态 反馈 阵 天 


Qo 


1 _ op, 0 
(BK ) M+MBK= BN 14+52 1 M M| 4+T (5-117) 
使 得 闭环 系统 特征 值 (4 十 BK)ES,. : 
证 明 知 (4 十 BK)ES,, 则 由 引 理 5-2 知 , 必 有 | 
] 一 , 
a Hiattsr| | <1, 1 一 1] ,2,*" ,nn (5-118) 
因 N 与 M 均 为 正定 对 称 和 矩阵， 让 3 知 , 有 
1 一 6 p a 
| aB | -3! | mutual | I =—N 


上 起 经 堤 理 后 可 得 式 (56.117) 
。 180* 


$. 4.3 ”状态 反馈 阵 与 性 能 指标 的 关系 


引 理 $5-4 ”对 于 完全 可 控 系 统 (5-114), 若 B 列 满 秩 、 一 KB 对 称 非 负 、(4 十 BK) 渐 近 
稳定 , 则 存在 对 称 正定 矩阵 R 和 状态 反馈 阵 K 二 一 R 'B P, 其 中 P 为 对 称 非 负 和 矩阵 ,是 如 
下 方程 

P=—K'R(— RKB)!+RK+Y (5-119) 
的 一 般 解 。 式 中 ,7=Y ,满足 BY 了 =0。 
若 KB 非 奇 异 , 则 有 


P=—=K'R(—KB) iKY ' (5-120) 
定理 $-9 考虑 完全 可 控 系 统 (5-114), 召 列 满 秩 , 若 
Q) A(ATBK)ES,, 1 二 1 ,42,"**,n 


一 KB 为 对 称 非 负 和 矩阵 。 

(3) —[K'R(C—RKB) “RK+Y]| A+ 5! 
对 称 非 负 , 其 中 Y 一 7 ,BTI7 一 0。 
则 当 R 正定 对 称 时 , 必 存 在 非 负 对 称 的 P 和 0, 满足 


一 | 4 十 1 [KR(—RKB)TRK-Y | 


P=K'R(— RKB)'Y (5-121) 
1—B 加 | a T T ee 
C=——P| 31 el |AtTBl) | PHKIRK (5-122) 


式 中 ao>0,0 妇 0 一 1 。 
证 明 由 条 件 中 和 包 , 根 据 引 理 5-4 有 非 负 对 称 的 矩阵 了 满足 式 (5-121)。 因 为 


1—p 
"a8 >0 


故 由 条 件 @@ 及 式 (5-121) 知 
_»[1—8B a 1— Bf: 
P| -元 8 -| -8! 
且 对 称 。 由 引 理 5-3 知 , 在 有 a 和 8p 约束 时 ,P 四 
~—p 1—p 
P| 二 aB 一 8 | 上 +- 款 ap | -8 
在 上 式 中 代入 KK= 一 R- 站 因 下 全 对称, 必 才 KK RK 非 负 对 称 , 因 而 @ 

为 非 负 对 称 和 矩阵 。 
推论 ”在 定理 5-9 中 ,车 取 RR 为 单位 阵 , 则 必 存 在 非 负 对 称 的 P 和 0, 满足 

P=K’'(—KB)+:K-Y (5-123) 


8) -| 


1 一 A 


T 
| p30 


T 
| P—PBR 五 PP 十 CO 一 0 


oPr[ i | 


5. 4.4 地 最 优 调节 器 的 设计 步骤 


逆 最 优 调节 响 的 设计 ,可 按 如 下 步骤 进行 
(给 定 正 定 对 称 矩 阵 N ,一 般 可 取 N=1., 


T 
T 
3 中 P+KTK (5-124) 
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@ 由 式 (5-117) 求 出 使 用 为 对 称 正定 矩阵 的 K 的 取 值 范围 。 
(3) 由 定理 5-9 检验 所 取 K 阵 是 否 满足 条 件 包 和 外, 符 不 满足 则 返回 至 2), 重 取 多 
阵 ,直至 条 件 满足 。 
由 取 R=1, 按 式 (5-121) 和 式 (5-122) 分 别 计算 P 和 00。 
取 0 为 对 角 块 阵 , 可 得 使 K 成 为 最 优 反 馈 增 益 阵 的 性 能 指标 (5-115)。 
@ 由 R=$ 和 QQ 一 diag {00, 尼 } ,可 得 原 系统 要 求 构造 的 性 能 指标 (5-109)。 
例 5-7 设 惯性 导航 系统 单 轴 水 平 回 路 状态 方程 为 
Ov,(t) = 20(7) 
7 060)=—6v,G) +u(t) te 
式 中 6v,(?) 为 陀螺 y 轴 方 向 速度 误差 ,09(2) 为 平台 姿态 角 ,u(t) 是 加 在 陀螺 力矩 受 感 器 上 
的 电压 ,ej 为 陀螺 漂移 ,可 看 成 未 知 定常 扰动 。 若 令 
X(t)=L6v,) O00) zz) 1 
z(t)—=wu(t)+e, 


u(t) =u() =) 


0 2 0 0 
—1] 0 or oho 
0 0 0 0 
要 求 设计 一 最 优 控制 器 ,使 系统 的 稳定 度 满足 a 二 1. 3,8= 0.5, 并 使 系统 的 状态 和 输出 在 
稳 态 下 不 受 常 值 陀螺 漂移 的 影响 。 

解 ”构造 如 下 性 能 指标 : 


J=| er sxT CIO KE) + ru Ct) di 
0Q 


yi Y, 0 
Y= [ 六 5 


0 0 0 


则 增 广 状态 方程 为 


X(t) 一 


由 BT 了 二 0 可 知 


式 中 Y,,Y, 和 Ys: 待定 。 取 N= 二 1 ,并 取 
K=—[3.2 21.59 8.3] 


算得 


18013.08 31603.09 5474.52 
3053.15 5474.52 960.56 
显然 ,MM 阵 对 称 且 正 定 。 取 +=1, 算 得 

Y,—31.13, Ys=58.12 


1 十 1.23 39.45 3.2 
P=| 39.45 -114.17 21.59 


3.2 21. 59 8.3 


ots 59 18013.08 3053., 
M = 


从 而 求 出 
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以 及 


一 4 六 十 66.08 一 1.547 一 2.69 0 
Q= |—1.547Y1—2.69 —112.05 0 
0 0 2. 45 


为 保证 P 宇 0 和 0Q 宇 0,Y, 的 取 值 范围 应 为 
18. 74<Y, 志 166. 88 
于 是 , 原 系 统 性 能 指标 应 取 式 (5-109) 形 式 , 其 中 稳定 度 取 a==1. 3, 各 权 和 矩阵 取 为 
一 47, 十 66.08 ”一 1.54Y, 一 2. 9 
-一 1. 547, 一 2. 69 一 112. 05 


不 难 验证 , 原 系统 的 特征 值 为 土 Vv3 ji 最 优 闭环 系统 的 特征 值 为 一 2. 9 和 一 2. 7 十 
j0. 8, 全 部 位 于 要 求 的 $,, 区 域内 ;系统 在 稳 态 时 不 受 s 的 影响 。 


5.5 离散 状态 调节 器 


离散 状态 调节 器 问题 实质 是 线性 离散 系统 和 线性 二 次 型 离散 性 能 指标 的 最 优 控制 问 
题 ,离散 状态 调节 器 问题 的 最 优 解 可 以 用 离散 极 小 值 原理 的 方法 求 得 ,也 可 以 用 离散 动态 
规划 的 方法 求 得 。 两 种 方法 所 得 结果 完全 一 致 。 本 节 将 应 用 离散 动态 规划 方法 求解 离散 
状态 调节 句 。 
问题 S-5 设 线 性 离散 系统 状态 差分 方程 
X(R 十 1) 一 ARD)XCRD) 十 有 (RD)UECR)， CO) 一 Xu (5-125) 
式 中 二 0,1,…,N 一 1。 性 能 指标 


NO—1 
J— Fx CNPCN)+ 3 OD) Lx (EQOA Hu (ERA)] (5-126) 
k=0 


式 中 x(k) 为 n 维 状态 向 量 序列 ;w(%) 为 m 维 控制 向 量 序列 , 且 不 受 约束 ;A(k) 和 BC(k) 为 
维 数 适当 的 矩阵 序列 ;F 为 对 称 非 负 定 权 和 矩阵 ;QC(%) 和 RC) 分 别 为 非 负 定 与 正定 对 称 权 
答 阵 序列 ;FQ(k)、RC(k) 的 维 数 适当 。 要 求 一 最 优 控 制 序列 w* (8),k 二 0,1,…,N 一 1, 使 
性 能 指标 (5-126) 极 小 。 

需要 指出 ,在 连续 时 间 情 况 ,我 们 要 求 RG) 正 定 , 一 方面 是 形成 线性 最 优 控制 律 的 需 
要 ;为 一 方面 则 是 在 物理 上 排除 使 用 无 限 大 的 控制 使 状态 在 无 限 短 的 时 间 内 趋 于 零 的 可 
能 性 。 而 在 离散 时 间 情 况 ,不 可 能 在 无 限 短 的 时 间 内 使 状态 趋 于 零 , 故 无 限 大 控制 的 出 现 
是 不 可 能 的 ,因此 ,对 于 离散 时 间 系 统 , 在 物理 上 并 没有 必要 使 R() 正 定 ,但 是 ,如 果 RCk) 
不 正定 ,最 优 控制 律 会 变 得 不 唯一 (尽管 仍 是 线性 的 )。 为 了 避免 出 现 这 种 复杂 性 ,我 们 仍 
然 提 出 对 R() 的 正定 性 要 求 。 

问题 5-5 是 有 限时 间 离 散 状 态 调节 器 问题 。 可 以 证 明 , 其 最 优 控 制 是 一 种 线性 状态 反 
僻 规 律 , 而 且 最 优 性 能 措 标 是 初始 状态 的 二 次 型 函数 ,这 些 结果 了 相应 的 连续 状态 调节 吉 
的 结果 相似 。 

定理 $5-10 对 于 有 限时 间 离 散 状态 调节 器 问题 5-5, 存 在 唯一 的 线性 状态 反馈 最 优 
控制 序列 


R=2. 45， 0=| | 


u  (k)=—K(k XR), k=0,1,…,N—1 (5-127) 
189。 


最 优 性 能 指标 
J* [xC0) ,0]=5x7(0)P(0) (0) 


式 中 反馈 增益 矩阵 序列 


K(k)=[B' (RIPOEHIIBGE) SRGE) | 'B' (Rk)P(ER1)AC(E) 


而 PC(&) 是 下 列 离散 黎 卡 提 方 程 的 对 称 非 负 定 解 


P(Ek)= [LACKR)— BO(EIKOGE)) PECI)LACR) — BAEKCE) | 
十 慌 (ERCEOKCE) -HOE), k=0,1],'* ,NO—1 


边界 条 件 为 
P(N)=F 


和 证明 由 贝尔 曼 最 优 性 原理 ,最 优 性 能 指标 为 


J*|xCk) ,kJ=—min( a [x (RQ CE) FuT RCE) + [xCk 二 1),k 十 1 ]) 


没 
T° [x Ck) sk]— Fx (RP YE) 
式 中 P() 为 待定 对 称 和 矩阵 序列 。 在 式 (5-133) 中 , 令 & 一 N, 有 
六 [xxCN) ,N]= 了 xzTCN)PCOV)x(CN) 


由 给 定 的 性 能 指标 可 知 
J[xCN) ,NJ]=3xT(N)Fx(N) 
比较 式 (5-134) 与 式 (5-135) 得 边界 条 件 (5-131)。 
显然 ,在 式 (5-133) 假 设 下 ,应 有 
T° [x (kT1) kt1]= STD PET Lr 1) 
将 状态 方程 (5-125) 代 入 上 式 , 可 得 
J * [xCRt1),k+1] 
= [A TB TP E+ DEAC) YE) + BEuCk)] 


将 式 (5-133) 和 式 (5-136) 代 入 式 (5-132), 有 
X (有 )P(R)X(RE) 一 min{r (AILC(CA) 十 4 (RIP(E+T1)ACE) Jx(k) 


2u (RBI (RIP(ERH1I)ACR XE Tu kk) 。 
EBT OR)POR+1IBGE) RE) lu(k))} 


at»)} 


uk 


得 


2BT (EPOETF I AC XE HBT AIPETIDBA RE) uk) =0 


(5-128) 


(5-129) 


(5-130) 


(5-131) 


(5-132) 


(5-133) 


(5-134) 


(5-135) 


(5-136) 


(5-137) 


(5-138) 


当 RC(%) 对 所 有 上 正定 时 ,[B (k)P(& 十 1)BCk) 十 R(k)] 通 常 是 正定 的 ,因此 最 优 控 制 序列 


u” (Ek)=—K(E)x(k), k=0,],."……,N—!1 
»* 190* 


(5-139) 


式 中 美 (&) 如 式 (5-129) 所 示 。 因 为 


ao” ® 》 T 0 
Ti BT CPT DBE) +RE)> 


所 以 式 (5-139) 能 满足 式 (5-137)。 
将 式 (5-139) 代 入 式 (5-137), 可 得 
x (R)P(R)XCR) 一 X (RD)OCR) 十 4 (RD)PCR 十 1)4(E) 
一 2 天 (Rk)B' (RP(ET1)ACGR)+K' (ER) 。 
[B (Rk)P(ECI)BGE) RGE) IK CGE) }xCEk) 
上 式 对 任意 非 零 x(&) 均 成 立 , 因 此 P(&) 满 足 
P(A) 一 OCR) 十 4 CRIPCETI)ACR)— KT (EIBT RIPE1)AC) 
—A (Ek)PCETIBCGEIKCGE) FH KT LB EIPOREHTIN BEE) FRE) IKCE) 
k=0,1,.…,N—1 (5-140) 


对 上 和 式 略 加 整理 ,可 得 
P(ER)=LACR)— BIKCGE) TP ACR) — BAEKCE)] 
+K CIRCEOKCOER) HOGR), k=0,1,.,N—1 
于 是 证 得 式 (5-130)。 
由 式 (5-130) 和 和 式 (5-131) 显 然 可 见 ,P(%) 是 对 称 非 负 的 。 
在 逆 同 递 推 过 程 中 , 当 训 =0 时 ,由 式 (5-133) 可 得 最 优 性 能 指标 


六 [xz(0) ,0]= x"(0)P(0)xC0) 


于 是 证 得 式 (5-128)。 

如 采 问 题 5-5 中 性 能 指标 (5-126) 内 没有 1/2 这 个 系数 , 则 在 定理 5-10 的 结论 式 (5- 
128) 中 也 没有 系数 1/2, 其 余 结论 不 变 

离散 状态 调节 器 的 结构 图 如 图 5-5 所 示 。 


+ x(k+1) 、 XO 
SO 


| 和 


u(K) 


图 5-5 ”离散 状态 调节 器 结构 图 
由 定理 5-10 可 见 , 反 馈 增益 矩阵 K(k) 取决 于 系统 的 系数 和 矩阵 4Ck)、B C2) ,以 及 性 能 
指标 中 的 权 和 矩阵 .QC&) 和 RCE) ,而 与 初始 状态 x(0) 无 关 。 因 此 ,实现 图 5-5 所 示 闭 环 最 
优 控制 时 ,可 以 离线 算出 K(k) ,在 线 只 进行 w* (8) 二 一 K(k)x(&) 的 简单 运算 ， 
离散 黎 卡 提 方 程 (5-130) 的 求解 可 利用 逆向 递 推 方法 进行 。 将 (4) 表达 式 (5-129) 代 
人 殖 卡 提 方 程 (5-130), 可 得 
PE) 一 CCC) 十 4 (RE)P(E 二 1)4(E) 一 4T(E)P(GRE 十 1)B(R) 。 
[有 CRYPCOETIBOE) TRGE) IBTORIP E+ 1)ACE) (5-141) 
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为 了 便于 和 迭代 计算 , 令 
Zk)=O(R)HA (RD)P(E 十 1)4(R) 
2Z, Ck)=B'(k)P(ERH1)ACE) 
Zs Rk)= RE) CB (RPE 1) BE) 
则 有 
K(k)=2Zs (k)Z,(k) 
P(k)=Z1(k)— ZI (Rk)Z3 (Rk)Z,(k) 
这 样 ,可 按 如 下 步骤 求解 离散 状态 调节 器 问题 : 
QD 由 已 知 五 ,得 P(N)=F， 
书 令 &= 和 一 1, 按 式 (5-142) 一 (5-144) 计 算 Z1 (4)、Z,(&) 和 2;(&)。 
@@ 按 式 (5-145) 计 算 K(k)， 
@) 按 式 (5-146) 计 算 PC(&)。 
@) 按 式 (5-127) 计 算 w* (&)，。 
令 k 二 N 一 2,N 一 3,…,1,0, 重 复 以 上 步骤 。 
(7 按 式 (5-128) 计 算 7 * [x(0),0]。 
例 5-8 已 知 离散 系统 
Xk 十 1)=7rz() 2u(k) 
试 求 量 优 控 制 序列 {u* (0) ,wu” (1),u* (2)], 使 性 能 指标 
J 一 ‘ [zx (Rk)ru: CR) |] 


点 一 


为 最 小 。 其 中 > 为 正 数 。 
解 ”本 例 为 离散 状态 调节 器 问题 。 由 题 意 
A=1, 8 一 2， 下 =0，0=-1，R=r， N=3 
由 令 &= 和 =3, 得 P(3) 一 巨 一 0。 
四 令 有 =2, 算 得 
: Zi(2) 一 0O(2) 十 4I(2)P(3)4(2) 一 1 
ZC2)=B (2)P(3)A(2)=0 
Zs3(2)=R(2)+B' (2)P(3)B(2)=r 
求 出 
K(2)=2;'(2)2,(2)=0 
P(2)=2Z1(2)—2Z7(2)K(2)=1 


Z1(1)=0(0)++A'(1)P(C2)A(1)=2? 
2Z,(1)=B' (1)P(2)A(1)=2 
Z3(1)=R(1)++B' (1)P(2)B(1)=r+4 


K(D=25" (1)Z(1) = 
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《5-142) 


(5-143) 
(5-144) 


(5-145) 
(5-146) 


POD=Z20) ZODKGO) = 


44 
Z1(0)—Q(0)+ATCOPI)ACO) = 
4(r 二 2) 
Z.(0)=B (0)P(1)4(0)= ny 
加 1 _ (7 十 4) 十 47 
Z:(0) 一 R(O) 十 BT(O)P(1)B(O) 一 人 人 
求 出 
1 4(r 十 2) 
加 Tt 37" 十 287r* 十 80r 十 64 
(5) 计算 最 优 控 制 序 列 
sn 2) 
uw (0)=—K(0)x(0)= CA a0 
ur (DD)=— RKO)=— ex(1) 


7 十 4 
U (2)=—K(2)x(2)=0 


习 题 


5-1 设 有 函数 
1=| {gy 6) -y(tu) )dt 


个 好 的 性 能 指标 图 数 ? 为 什么 ? 


5-2 由 有 限 个 互相 连接 的 电阻 .电容 .电感 和 变压器 所 组 成 的 电网 络 ,通常 可 用 下 述 


状态 空间 方程 描述 
T(t) = Ax(t) Bu(t) 
y(t)=Cx(t) Du tlt) 


状态 回 量 x() 的 分 量 通 常 对 应 于 电容 副 的 电压 和 电感 磊 的 电流 ,控制 同 量 w(tz) 的 分 量 对 
应 于 该 网 络 各 端口 电流 ,而 输出 四 量 (0 的 分 量 则 对 应 于 网 络 各 端口 的 电压 。 假 设 初始 


状态 X(to) 不 为 零 , 试 对 下 式 
J = | xT CCT FuT Ct) Daud) Jdi 
的 极 小 化 问题 进行 物理 解释 。 
5-3 设 系 统 方程 为 


(tt) = Ax(t) + Bult) 
y(t) =Cx(t) 
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性 能 指标 
7 一 | [ExT OQxrC) FuT Ge) Raul) ld 


式 中 4、B.C.Q 和 RR 为 常 阵 。 试 说 明 选 择 0 二 C'C 以 及 R=T 的 物理 意义 。 
5-4 ”对 于 有 限时 间 状 态 调节 器 问题 5-1, 若 去 掉 性 能 指标 / 中 的 系数 1/2, 试 重新 扒 
证 最 优 控 制 律 , 歼 卡 提 方程 和 边界 条 件 , 以 及 最 优 性 能 指标 。 
S$-$ 给 定 一 阶 系统 
Z(t)=u(t), x(1)=3 
性 能 指标 
J=z2(5)+| Su Ct)d 


试 求 最 优 控制 w" (zt) 和 最 优 性 能 指标 7 。 
5-6 已 知 一 阶 系统 状态 方程 


z(t)=— z(t) +ult) 
当 z= 王 0 时 ,过 (t) 一 2; 当 鼠 王 1 时 ,ztr) 自 由 。 性 能 指标 
J=5z°(1)+3| [2zzG) 十 oO]d 
试 求 最 优 控制 w* (和 最 优 轨 线 z* (2)。 
$5-7 ` 设 线性 系统 状态 方程 
X(t)—=ACGxXG) HB uC) 


式 中 矩阵 4(t) 和 B8() 具 有 连续 酒 数 的 元 。 试 证 :不 存在 这 样 的 控制 律 
u(t)=—K(t) x(t) 
使 得 对 任意 的 x(t。) 和 有 限 的 ty, 有 x(iy) 一 0。 其 中 ,K(z) 的 各 元 是 连续 的 。 
5-8 给 出 下 列 二 阶 系统 : 
Zi1(t) = r,t) 
Z(t)—=u(lt) 


试 确定 最 优 控 制 w* (2) ,使 下 列 性 能 指标 极 小 
7 一 到 [zi(3) 十 2z3(3)] 十 于 | [2 + 4) 27 zd) + ius) Jds 
5-9 给 定 一 阶 系统 
0= 一 元 zGD) 十 CD)， x(0) = 


取 性 能 指标 
: J=3)| [gx Ct) +ru: lt) dt 
式 中 加 权 系 数 选 为 
_1 1 
da? 7” 三 


zw 和 zu 分 别 是 z() 和 w(t) 的 最 大 值 。 试 求 最 优 控制 a" (4) 和 闭环 响应 x* (1) ,并 对 这 样 
选择 加 权 系数 的 意义 进行 讨论 ， 
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5-10 已 知 系统 状态 方程 
zi1(t)=— Xx1(t) u(t) 


性 能 指标 
7 一 | [zt 十 xz) Jdt 


试 求 最 优 控制 u* (z)。 

5-11 在 定理 5-4 中 ,8 一 DD 的 分 解 是 不 唯一 的 。 试 证 ;14， D) 是 否 可 观 仅 提 QC 次 
定 ,而 与 8 的 分 解 无 关 。 

5-12 试 证 命题 5-4 成 立 。 

s-13 “对 于 无 限时 间 定 常 状态 调节 器 问题 5-3, 已 知 


A Al, 及; 
4=-| 4 | p=| | 
系统 不 完全 可 控 ,。 试 证 ; 若 4;s 的 特征 值 均 有 人 负 实 部 , 则 仍 能 求 得 该 无 限时 间 定 常 状 态 调 节 
器 问题 的 一 个 解 。 
5-14 已 知 一 阶 系统 方程 
T(t)=axr(t) ult) 
性 能 指标 
J 一 | [wD) +6r:0) di 
式 中 a.2 均 为 常数 , 且 5 汪 0。 试 证 最 优 闭环 系统 总 是 渐 近 稳定 的 。 
5-15 试 证 :定理 5-5 中 , 黎 卡 提 代 数 方 程 (5-71) 的 对 称 正定 解 P 是 唯一 的 。 
(提示 :和 矩阵 方程 4K 十 B= 二 0 在 对 任何 i 和 ;及 LA4j 十 丸 LBj 关 0 的 条 件 下 ,只 有 了 唯 
一 解 对 二 0.) 
5-16 设 二 阶 系 统 如 图 5-6 所 示 。 试 写 出 系统 的 可 控 标准 型 ,并 求 使 性 能 指标 
1=| [gy (+r Ce) di 
为 极 小 的 最 优 控 制 u* (GG)。 其 中 ,r 和 9 为 已 知 正常 数 , 且 图 中 各 系数 之 间 关 系 满足 


ci+ac2azcicz 


5-17 试 求 下 列 歼 卡 提 和 矩阵 代数 方程 的 正定 解 : 
PA+-+A'™P—r-!'Pbb'P+ac'c=0 


式 中 
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O 1] 0 0 
4 一 | 0 0 | b= 中 c=[] 0 0 
—a 0 0 ] 
并 设 r 和 9 为 正常 数 , 另 设 8= (a 十 gq/r)”。 

5-18 设 一 阶 系统 方程 为 


Z(t)=ax(t) iu(t) 
性 能 指标 
J 一 | em 人) 十 6z2(D]di 
式 中 a,b,a 为 常数 ,5 和 a 非 负 。 试 求 最 优 闭环 系统 特征 值 4, 并 用 图 解 方 法 表示 4 随 a、6 
和 a 变化 时 的 情况 。 : 
5-19 ” 设 线 性 定常 系统 
(1t) — Ax(t) + Bult) 


性 能 指标 
7 到 | [xT Ox C4) Fu Rud) Jd 


式 中 4 和 8B 为 常 阵 ,R 为 正定 对 称 常 阵 ,Q 为 待定 的 非 负 定 对 称 常 阵 。 已 知 {4,B}) 完 全 可 
控 ,{4, 妃 }) 完 全 可 观 , 其 中 万 为 任 一 满足 DD'7 一 0 的 矩阵 。 试 证 该 系统 的 最 优 控 制 可 以 与 
问题 5-4 的 最 优 控制 相同 。 


5-20 已 知 V(x) 二 xTG)BPx() 为 具有 VGA/V (Cx) 过 一 2a 性 质 的 李 雅 普 诺 夫 函 数 。 
其 中 a 二 0,P 满足 式 (5-103), 试用 李 雅 普 诺 夫 稳 定性 定理 证 明 最 优 闲 环 系统 (5-104) 是 浙 
近 稳 定 的 。 

$-21 试用 离散 极 小 值 原理 证 明定 理 5-10。 

$5-22 设 二 阶 离散 系统 

0 
1 


0 1 1- 
rtD=| | atk), x(0)=| -| 
性 能 指标 
J= > [zi(RE 十 1) 十 zx2(R)] 
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第 6 章 ”线性 最 优 输 出 调节 器 与 跟踪 系统 


一 个 工程 实际 系统 , 当 工 作 于 调节 上 船 状 态 时 ,总 是 希望 系统 一 旦 受 执 偶 离 原 平衡 状 
态 ,系统 的 输出 能 最 优 地 恢复 到 原平 衡 状态 ,这 样 的 问题 称 为 最 优 输 出 调 书 句 问 题 ; 如 果 
系统 工作 于 跟踪 船 状态 , 则 要 求 在 布 望 输出 信和 叶 的 作用 下 ,系统 的 实际 输出 能 最 优 地 跟随 
布 望 输出 的 变化 ,这 样 的 问题 称 为 最 优 跟 蹊 系 统 问 题 . 因 此 ,研究 输出 调节 希 己 跟踪 系统 ， 
更 符合 工程 实际 要 求 。 当 然 ,我 们 仍 限 于 在 线性 二 次 型 意义 下 进行 讨论 。 


6.1 输出 调节 天 


寿 被 控 系 统 完 全 可 观测 , 则 系统 的 输出 调节 器 问题 可 以 转化 为 等 价 的 状态 调节 器 问 
题 ,并 可 将 状态 调节 器 的 结果 加 以 推广 ,得 到 输出 调节 器 的 最 优 控制 律 。 


6.1.1 有 限时 间 输 出 调 忆 如 


问题 6-1 设 线 性 时 变 系统 动态 方程 
(2)=A(DX TBOAu), x(to)=xo (6-1) 
z y(t)=C(t)x() (6-2) 
式 中 x(2) 为 n 维 状态 向 量 ;u(2) 为 m 维 控制 向 量 , 且 不 受 约束 ;y(t) 为 /1 维 输出 向 量 ;和 矩阵 
A()、B(t)、C(i) 维 数 适当 ,其 各 元 连续 且 有 界 .要 求 确 定 最 优 控制 u* (2) ,使 下 列 性 能 指标 
极 小 : 


J] 一 yDFy G4) 二 六 | EyT OO yA Fu RA di (6-3) 


式 中 下 为 对 称 非 负 定常 阵 ,8(z) 和 RG) 分 别 为 非 负 定 和 和 正定 对 称 和 矩阵 ,其 各 元 连续 日 有 
界 ,tf 固定 ,0 二 /和 m 二 nn。 

上 述 问题 称 为 有 限时 间 输 出 调节 器 问题 。 其 实质 是 , 求 得 的 最 优 控 制 律 w* (4) ,能 使 
系统 在 消耗 较 少 控制 能 量 的 情况 下 ,控制 过 程 和 末端 时 刻 的 输出 都 尽 可 能 接近 于 零 .如 果 
性 能 指标 中 不 含 末 值 项 , 则 表示 对 末端 时 刻 的 输出 偏差 没有 要 求 。 

可 以 证 明 , 当 系统 (6-1)、(6-2) 完 全 可 观 时 ,问题 6-1 可 以 转化 为 相应 的 状态 调节 器 
问题 。 

引 理 6-1 在 问题 6-1 中 , 若 阵 对 {4G),C()} 完 全 可 观测 , 则 下 列 和 矩阵 ， 

Fl=C Cr)FCCr) (6-4) 
OQ) =C CIOCDC 人 (6-5) 
必 为 对 称 非 负 定 和 矩阵。 

定理 6-1 对 于 有 限时 间 输 出 调节 器 问题 6-1, 若 阵 对 {4( ,CCG))} 在 如 时 刻 完全 可 

观测 , 则 存在 唯一 的 最 优 控制 
u” (12)—=—R (GG)B' (PG)x() (6-6) 
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最 优 性 能 指标 


J* [x (C0) 110]= xT GOP ro) (6-7) 
最 优 轨 线 x" (2) 满足 下 列 线性 微分 方程 ; 
TG)=[AG)—BOR GB GPG) lxG), x(to)=xo (6-8) 


式 中 PQ) 为 对 称 非 负 定 矩阵 ,是 下 列 歼 卡 提 方 程 : 
—PG)=PG)AG)T+A GIPG)—POBGR 0)B (GPG)+C (OCG) (6-9) 
在 边界 条 件 
Pl/)=C (FFC) (6-10) 
下 的 唯一 解 。 
证 明 将 输出 方程 (6-2) 代 人 性 能 指标 (6-3) ,得 


/= Fx (t/)F x(ty) 二 | [x (OCX CE 十 EC) 到 (DG ld 


式 中 Fi 及 Q1() 分 别 由 式 (6-4) 与 式 (6-5) 描 述 。 

因为 {(4(),CQ) 在 加 完全 可 观测 , 故 由 引 理 6-1 知 ,P 及 Q1(2) 为 对 称 非 负 定 矩阵 ， 
而 RQ) 已 由 问题 6-1 规定 为 对 称 正定 和 矩阵。 于 是 ,由 定理 5-1 知 , 本 定理 全 部 结论 成 立 。 

有 限时 间 最 优 输 出 调节 器 的 结构 图 如 图 6-1 所 示 , 由 图 可 见 , 最 优 输出 调节 器 的 最 优 
控制 消 数 ,并 不 是 输出 向 量 y() 的 函数 ,而 仍然 是 状态 向 量 x() 的 消 数 。 这 一 点 反映 了 一 
个 本 质问 题 , 即 构 成 最 优 控 制 系统 ,需要 全 部 状态 信息 .个 数 少 于 状态 维 数 的 任何 变量 ,都 
不 足以 完全 描述 一 个 动态 系统 , 即 不 足以 描述 系统 当前 的 状态 和 过 程 未 来 的 演化 。 实 际 
上 ,状态 回 量 在 每 一 瞬间 的 值 , 既 包含 有 确定 输出 向 量 所 需 的 全 部 信息 ,又 包含 有 预示 未 
来 状态 所 需 的 全 部 信息 . 维 数 少 于 状态 向 量 的 输出 向 量 , 仪 能 反映 状态 向 量 各 分 量 的 线性 
组 合 ,不 能 提供 预示 未 来 进程 所 需 的 全 部 信息 。 最 优 控 制 要 求 最 有 效 地 运用 全 部 信息 。 因 
此 ,除非 输出 向 量 维 数 等 于 状态 向 量 的 维 数 ,否则 输出 器 量 的 线性 反馈 不 能 实现 最 优 控 
制 ,最 多 只 能 实现 次 优 控制 。 定 理 6-1 也 表明 ,性 能 指标 的 最 小 值 也 不 能 由 输出 向 量 来 确 
定 , 只 能 由 状态 占 量 来 确定 。 


RWB (DPO) 


图 6-1 有 限时 间 最 优 输出 调节 和 殴 结 构图 


由 于 黎 卡 提 方 程 (6-9) 在 边界 条 件 (6-10) 下 的 解 P() ,是 一 个 时 变 和 矩阵 ,因此 对 于 有 
限时 间 最 优 输出 调节 器 ,即使 和 4.8、O、R 为 常 阵 ,其 最 优 反馈 增益 阵 R-1BTP(1) 仍 然 是 时 
变 的 ,但 是 , 当 各 和 矩阵 均 为 常数 矩阵 ,tj 一 co, 且 {4,B} 完 全 可 控 时 ,同样 可 以 得 到 定常 状态 
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反馈 控制 律 。 这 样 的 问题 称 为 无 限时 间 定 和 常 输 出 调节 囊 问 题 。 
6.1.2 无 限时 间 输 出 调 忆 希 


问题 6-2 ” 设 线 性 定常 系统 动态 方程 
X(t)—=AX()Bu(t), x(0)=xo (6-11) 
y(t)=Cx(t) (6-12) 
式 中 x(1)E RWU(1)ER”, 有 无 约束 ;y() ER',0 二 /过 m 二 nn;A4、B.\C 为 维 数 适当 的 常数 挫 
阵 。 要 求 确定 最 优 控制 & (2) ,使 下 列 性 能 指标 极 小 


/= 记 | Ly" QC) tu Ru) ld (6-13) 
总 


式 中 Q 与 及 分 别 为 对 称 非 负 定 和 对 称 正 定常 数 和 矩阵 。 
定理 6-2 对 于 无 腿 时 间 定 稼 输出 调节 顺 问 题 6-2, 知 阵 对 (4, 中 } 完 全 可 控 ,{(4,C)} 完 
全 可 观 , 且 对 于 满足 DD ==C QC 的 任何 DD, 阵 对 {4,D} 完 全 可 观 , 则 最 优 控制 


u* (1)—— RB'Px() (6-14) 
最 优 性 能 指标 
J = 5x (0)Pxr(0) (6-15) 
式 中 五 为 正定 对 称 常 数 矩 阵 ,满足 下 列 黎 卡 提 代数 方程 ， 
PA+A'™P— PBR-'BTP COCS=0 / (6-16) 
最 优 闭环 系统 
X(t)= (A—BR 1'B'P)x(t), x(0)—xo (6-17) 


是 渐 近 稳定 的 ,其 解 为 最 优 轨 线 x (2)。 
证 明 将 输出 方程 (6-12) 代 入 性 能 指标 (6-13), 得 


7=3| [x (Qix (0) tuT Rue) Jdt 


式 中 Q'=C CC 。 
因 {4,C} 可 观 ,8 非 负 对 称 , 故 由 引 理 6-1 知 ,Qi 为 对 称 非 负 定 常 阵 。 
令 和 矩阵 @ 的 任 一 分 解 为 .= 二 DD', 因 {4,B} 可 控 ,{4,D}) 可 观 , 由 定理 5-5 和 定理 5-6 
知 , 本 定理 全 部 结论 成 立 。 
例 6~1 设 系统 动态 方程 
Z1(t) = x (tt) 
za lt) =u lt) 
人 (一 
性 能 指标 
J=3| [y+ dt 


试 构造 输出 调节 器 ,使 性 能 指标 极 小 。 
解 ” 本 例 可 按 如 下 步 又 求解 。 
QD 检验 系统 的 可 控 性 与 可 观 性 。 由 题 意 有 
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en no 


1 0 : 
o,=croc=| | D 一 [1 0 |]， 并 一 1] 
0 0 
因为 


| 
站 > 


0 1 
rank| 号 4B] 一 rank| -| 


C 1 0 
rank 一 rank 一 2 
CA 0 1 
D' ] 0 
rank —rank 一 2 
DiA 0O 1 


所 以 ,4,B} 可 控 ,{4,C} 可 观 , {4,D} 可 观 , 可 以 构造 渐 近 稳定 的 最 优 输出 调节 器 。 
@ 解 黎 卡 提 代 数 方程 。 将 各 有 关 参 数 代 人 式 (6-16) ,不 难 求 得 
I 1 
b=— >0 
1 V2 
3) 求 最 优 控制 。 
u(t)=—R BPx()=— zr)— V2 X(t)=—y()— V 2 y(t) 
最 优 输 出 调节 器 结构 图 如 图 6-2 所 示 。 
检验 闭环 系统 稳定 性 。 由 式 (6- 17)， 
得 闭环 系统 方程 


0 
(2) =| jz 


1 
—] 一 v2 
图 6-2 ”最 优 答 出 调节 器 结构 图 易 得 闭环 特征 值 为 ,二 一 v2 /2 十 
i V 2 。 闭 环 系统 确 是 渐 近 稳定 的 。 
定理 6-2 的 成 立 条 件 是 要 求 {4,B} 可 控 ,{4,C} 可 观 且 {4,D}) 可 观 。 这 样 的 前 提 条 件 
强 了 一 些 。 可 以 证 明 , 车 适当 放宽 定理 条 件 ,其 结论 仍 可 成 立 。 为 了 便于 论证 ,简要 回顾 一 
下 线性 系统 理论 中 的 若干 基本 概念 。 
定义 6-1 稳定 子 空间 与 不 稳定 子 空间 。 
对 于 章 次 微分 方程 (4)= 二 Ax(1), 其 中 4 有 各 异 特征 值 , 则 所 有 由 负 实 部 特征 值 的 特 
征 向 量 所 张 成 的 线性 子 空间 , 称 为 稳定 子 空间 ;而 相应 于 有 非 负 实 部 特征 值 的 特征 向 量 所 
张 成 的 线性 子 空间 , 称 为 不 稳定 子 空间 。. 
定义 6-2 可 控 子 空间 。 
由 相应 于 可 控 特 征 值 的 特征 向 量 所 张 成 的 线性 子 空间 , 称 为 可 控 子 空间 。 
定义 6-3 可 观 子 空间 。 
由 相应 于 可 观 特征 值 的 特征 向 量 所 张 成 的 线性 子 空 间 , 称 为 可 观 子 空间 。 
定义 6-4 可 稳定 性 。 
对 于 系统 {4, 有 8), 若 不 稳定 子 空间 包含 在 可 控 子 空间 中 , 则 {4 ,了 3) 称 为 可 稳定 的 。 
定义 6-$ 可 稳定 性 。 
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对 于 系统 {4,B}, 当 且 仅 当 在 可 控 性 分 解 
+()=—| e+ | hue (6-18) 
0 4 0 


式 中 42s 渐 近 稳 定 , 则 44,B) 可 稳定 。 : 
在 式 (6-18) 中 ,{41,B1) 为 可 控 对 ,4(411) 为 系统 {14,B}) 的 可 控 特 征 值 ,4(4s;) 为 不 可 
控 特 征 值 。 
定义 6-6 可 检测 性 。 
对 于 系统 {14, 瑟 ,C), 行 不 可 观 子 空间 包含 在 稳定 子 空间 内 , 则 (4,8,C)} 称 为 可 检测 。 
定义 6-7 可 检测 性 。 
系统 {4,B,C} 为 可 检测 的 ,必要 且 仪 要 可 观 性 分 解 
A 0 B, 
+0=[ a +p | (6_19) 
y(t)=[C, 0 lx Cz) 
式 中 42; 渐 近 稳 定 。 
在 式 (6-19) 中 ,{4h11,C1} 为 可 观 时 ,AC411) 为 系统 {4,B,C} 可 观 特 征 值 ,4C4,;) 为 不 可 
观 特征 值 。 / 
根据 以 上 定义 ,可 以 证 得 如 下 定理 。 
定理 6-3 对 于 无 限时 间 定 常 输出 调节 器 问题 6-2, 若 给 定 黎 卡 提 和 矩阵 微分 方程 
—PG)=P()A+A' PCG)—PG)BR BP() +COC (6-20) 
边界 条 件 
Pr) 一 0 (6-21) 
则 
QD PG) 为 常 阵 P 的 充分 必要 条 件 是 {4,B} 可 稳定 。 
阁 {4,B} 可 稳定 ,4,C} 可 检测 , 则 PP 满足 如 下 获 卡 提 代 数 方程 (6-16) 
PA+A'P—PBR BP+-CIOC=0 
式 中 站 对 称 非 负 定 且 唯一 ;最 优 性 能 指标 


J — 3 x"(0)Pxr(0) (6-22) 
(3) 最 优 控 制 为 
u’ (1)—=—R-'B'Px() (6-23) 
且 堵 环 系统 
X(t)= (A—BR BB PrG), x(0)—~—xo (6-24) 


渐 近 稳定 的 充分 必要 条 件 是 {4,B}) 可 稳定 ,{4,C} 可 检测 。 
由 当 0 二 0 时 ,P>>0 的 充分 必要 条 件 是 {4,C} 可 观 。 
证 明 
(DP 为 常数 矩阵 。 不 失 一 般 性 , 设 {4,C} 可 观 , 则 系统 (6-11)、(6-12) 的 可 观 性 分 解 如 
式 (6-19) 所 示 。 若 仿 
P(t) PP,,() 
PC)=| ~ | 
Pis(t P,,(i) 
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则 黎 卡 提 微 分 方程 (6-20) 可 以 表示 为 
—P GG)=P,, CG)A+P Ct) A ANPy 0) A P10) 


— [PGB+P C0)B, IR ‘LBIP CG) + BIPYL CG) CIOC, (6-25) 
—Pis(t) = P(t) A ANPis(t) ADPz (i) 

一 [ PC)B,+P,()B, IR [BiIP,,() + BIP,,(t) | (6-26) 
—P,,(t) = P,,(t) A As,P,, (1) 

— [Pi()Bi+ Pt)B, JR 7 LBIP,,() + BIP,,() | (6-27) 


其 边界 条 件 分 别 为 :PiC/)=0,Pizs(i/)= 二 0,Pzz(t/) 二 0。 
由 式 (6-26) 和 (6-27) 可 见 , 这 两 个 矩阵 微分 方程 中 均 无 强制 项 , 故 在 边界 条 件 Pis (zy) 
一 0 及 Pz,(tj) 二 0 的 情况 下 ,只 能 有 Pi;(i) 二 0 及 P,,(t) 二 0, 于 是 得 
P(t) 0 
P=| | (6-28) 
0 0 
由 黎 卡 提 方 程 (6-25) 一 (6-27) 还 可 看 出 ,4: 表 征 的 不 可 观 特征 值 仅 出 现在 Pi;() 和 和 
P;;(2) 方 程 之 中 ,但 不 影响 PC ,从 而 对 PQ) 无 影响 .因此 ,讨论 PG) 是否 为 常 阵 , 设 {4， 
C} 可 观 并 不 失 一 般 性 。 | 
将 系统 (6-11)、(6-12) 进 行 可 控 性 分 解 , 其 形式 如 下 : 


Al! Ai, B, 

(ft) 一 x(t) 十 ult) (6-29) 
0 A,, 0 

yi 一 [CI C, lxG) (6-30) 


必要 性 ;P 存在 , 必 有 {4,B}) 可 稳定 。 
有 反 设 {4,B} 不 可 稳定 ,由 定义 6-5 知 ,4? 非 渐 近 稳定 。 由 于 (4) 二 Azzxa(t) ,使 得 limx， 
(1 一 coco。 从 而 7 一 ceo, 最 优 解 不 存在 ,P 因而 不 存在 。 这 与 假设 矛盾 , 故 反 设 不 成 立 。 
充分 性 :{4,B8} 可 稳定 必 有 P 存在 有 旦 为 常 阵 。 
因 {4,B} 可 稳定 ,由 定义 6-5 知 , {4h1,B1} 可 控 ,4ss 渐 近 稳 定 。 根 据 卡 尔 曼 论证 , 当 系 
统 可 控 且 P(r) 王 0 时 ,唯一 存在 
limP(#)=P=const (6-31) 
因此 有 
limPi (2)= P=const (6-32) 
根据 式 (6-28) 知 ,P() 一 五 为 常数 矩阵 。 
四 闭环 系统 渐 近 稳定 。 
“必要 性 :闭环 系统 渐 近 稳定 , 必 有 {4,B} 可 稳定 ,{4A,C} 可 检测 。 
右 闭 环 系统 渐 近 稳定 ,其 不 稳定 特征 值 必 可 控 , 不 可 观 特征 值 必 有 负 实 部 , 则 由 定义 
6-4 及 定义 6-7 知 , 必 有 {4,B8}) 可 稳 ,{4,C} 可 检测 。 
充分 性 ;{4,B8} 可 稳 及 {4,C}) 可 检测 必 有 闭环 渐 近 稳定 。 
对 系统 (6-11)、(6-12) 进 行 可 控 性 分 解 ,得 


4A=| | s=—| | C=rc C,] 
0 A 0 ”2 


必 
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Pp PP, (t) 
PO-| nt) | (6-33) 
Pis(t) P,,(t) 
则 由 黎 卡 提 方 程 (6-20) ,可 得 
一 五 (一 PC)4 +AT PC) —P (BR BIP(t) Ci OC (6-34) 
边界 条 件 
Pll(tr)=0 (6-35) 


因 {4,B}) 可 稳 ,{411,B1) 为 可 控 对 ,由 式 (6-32) 知 , 必 存 在 
P=limP1, (t,ty)=const 
使 (411 一 BR-'1BIP,,) 浙 近 稳 定 。 同 时 ,由 定义 6-5 知 , 当 {4,B) 可 稳 时 ,A;: 渐 近 稳 定 。 又 因 
{4,C} 可 检测 ,由 定义 6-6 知 , 不 可 观 特征 值 必 渐 近 稳 定 。 因 此 ,可 以 仅 由 可 观 部 分 进行 状 
态 反馈 。 令 


P,, 

将 式 (6-36) 代 入 可 控 性 分 解 式 (6-29) ,得 闭环 系统 

An—BIR- BIP,, Ais—BIR BIP,, 
0 A,, 


Py PP 
pI 
12 


u(t)=—R Bi 0]| ， |x() =—[R BE, : R71BiIP, |x() (6-36) 


x()=| J) =AC 0) (6-37) 


其 特征 多 项 式 
det (sI— A) 一 det| s1— (A —BR ‘BiP,,) ldet (sI— A,,) : 


上 式 表 明 ,闭环 系统 (6-37) 的 特征 值 
ACA)=A(A1— BIR- BTE,) U ACA,) : (6-38) 
因为 ReA(hu 一 BIR 1BIP1) 二 0,ReA(A,,) 二 0, 所 以 由 状态 反馈 控制 (6-23) 形 成 的 闭 
环 系统 (6-24) 是 渐 近 稳定 的 。 
PP 的 非 负 性 与 唯一 性 。 因 {4,8} 可 稳 , 由 结论 外 ,P 为 常数 矩阵 , 故 


SRT Br) = TT Px) + der (Pr) 
—3[AxC) + Bu() J Pr() + 5x PLAxC) + Bult)] 
上 式 两 问 从 0 到 积分 ,得 
Fx (Bx) — Sx" (0)Px(0) 
一 二 | “rd [PA+A P|]x() 2u (有 Px(t) }d (6-39) 
由 于 (4,B) 可 稳 ,44,C} 可 检测 ,根据 结论 乌 , 闭 环 系 统 渐 近 稳定 , lim x (sj) 二 0, 于 
是 有 
limz (tr)PxCtr) 一 0 
因此 , 式 (6-39) 可 表示 为 
— 3xT(0) Pr(0) = 这 | CerG) (P4 十 4 P)x(t)+2u (2)B Px(t) dt (6-40) 


将 式 (6-40) 写 人 式 (6-13) ,性 能 指标 可 表示 为 
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J =1[ [x (cc tu Ru tx CD) (BAA PY) 
0 
+ 2uT (BTPx() Jdtt x" (0)Px(0) 
— | (fu) 4 R71BTPxC) J RELuG) + RB Pxr()) 
心 


xr) (PAATP— PBR-'B'PC QC)x(t) jdt+ 5x (0)Px(0) (6-41) 
在 式 (6-41) 中 ,选择 
u(t)——R !B'Px(t) (6-42) 
BA-+A'P—PBR 'B'P+C OC=0 (6-43) 
可 使 J 二 min, 于 是 最 优 性 能 指标 


J" = 地 x (0)Px(0) (6-44) 


因而 式 (6-42) 为 要 证 的 最 优 控 制 , 式 (6-43) 为 P 应 满足 的 黎 卡 提 代 数 方程 。 
因为 对 所 有 x(0) ,J 宇 0, 所 以 


J 一 广 zT(0)Ex(0) 之 0， V xC0) 


故 必 有 五 六 0。 又 因 无 是 黎 卡 提 微分 方程 (6-20) 在 确定 的 边界 条 件 (6-21) 时 的 极限 解 , 根 
据 微 分 方程 解 的 性 质 知 ,P 是 唯一 的 。 

由 当 CO>0 时 , 尼 的 正定 性 。 

必要 性 : 疡 >0, 必 有 {4,C} 可 观 。 

反 设 {4,C)} 不 可 观 ,将 系统 (6-11)、(6-12) 作 可 观 性 分 解 ,得 P(z) 如 式 (6-28) 所 示 。 因 
为 detP(i) 一 0, 故 P() 非 正定 ,从 而 其 稳 态 解 P 非 正定 ,与 假设 矛盾 , 反 设 不 成 立 。 

充分 性 :{4,C} 可 观 必 有 P 二 0。 

有 反 设 P 非 正定 , 则 存在 非 零 x(0) ,使 有 


Fx (0)Px(0)=—0, Y x(0)#0 
从 而 
Tx) Px(0)=3)| [Ly (0y (tu GRu’ CG)ldt=0, Vx(0)¥0 (6-45) 


式 中 y" (1) 为 最 优 输出 ,wu (2) 为 最 优 控 制 ,0 二 0,R 二 0，。 
式 (6-45) 表 上 明 , 当 系统 存在 非 零 初始 状态 x(0) 时 ,应 取 w* (1)==0, 可 使 y* (zt)= 二 0， 
Y 1E€[0,o0)。 显然 ,这 是 蒂 雇 的 。 因 此 反 设 不 成 立 , 必 有 P 二 0，。 


6. 1.3 输出 反馈 次 优 调节 器 


输出 调节 器 的 最 优 控制 律 ,要 求 用 全 部 状态 变量 的 反馈 来 实现 。 这 是 不 难 理解 的 。 因 
为 既然 是 最 优 控制 , 那 就 应 该 由 反映 系统 内 部 运动 状态 的 全 部 信息 构成 控制 律 。 但 在 工程 
实际 中 ,并 非 所 有 的 状态 变量 都 能 测 取 , 而 系统 的 输出 量 却 都 是 可 以 测量 的 ,因此 ,利用 输 
出 反馈 构成 最 优 控 制 系统 问题 ,引起 了 工程 技术 界 的 广泛 兴趣 。 

所 谓 输出 反馈 ,是 指 用 全 部 输出 变量 来 组 合 控制 向 量 , 即 由 维 数 较 低 的 输出 向 量 构成 
输出 反馈 控制 系统 .由 于 所 采用 的 信息 不 完全 ,输出 反馈 能 达到 的 最 小 性 能 指标 总 要 大 于 
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状态 反馈 能 达到 的 最 小 性 能 指标 。 因 此 ,输出 反馈 调节 顺 只 能 是 次 优 的 。 
问题 6-3” 设 完全 可 控 且 完全 可 观 的 线性 定常 系统 动态 方程 
X(t1)=Ax(t)TBut), x(0)S=xo (6-46) 
3y (1 一 CYCLE) (6-47) 
式 中 x GQ)ER' uC()ER", 且 无 约束 ;yy ER ,0 二 /之 m 达 n;4、B.C 为 维 数 适当 的 常数 矩 
阵 。 试 确定 输出 反馈 次 优 控 制 律 : 


u(t)=— Ky(t)=— KCx(t) (6-48) 
式 中 天 称 为 输出 反馈 增益 阵 ,使 下 列 性 能 指标 极 小 
/= 二 | [xT()Qx (0) tu Rud) dt (6-49) 
式 中 8 和民 均 为 对 称 正 定常 数 和 抢 阵 。 并 使 闭环 系统 


渐 近 稳定 。 其 中 4 一 4 一 BKC 。 
输出 反馈 系统 结构 图 ,如 图 6-3 所 示 。 将 式 (6-48) 代 人 式 (6-49) ,得 


7 一 到 | [x (2)Qx (1) + xT (CIRTRKCxC) Jdt=3| x (Ord (6-51) 
0 0 


式 中 
一 QT 二 CIKTIRKC (6-52) 


(| 


图 6-3 输出 反馈 系统 结构 图 
下 面 及 用 李 雅 普 诺 夫 第 二 法 讨论 ,如 何 确定 反馈 增益 阵 下 , 既 能 保证 闭环 系统 (6-50)》 
渐 近 稳定 ,又 能 使 性 能 指标 (6-51) 极 小 。 
对 于 正定 实 对 称 常 阵 了 , 取 李 雅 普 诺 夫 函数 
V(x)=x Px (6-53) 


式 (6-53) 两 边 对 zt 取 导 数 , 得 
VO) =xTPr rips 
将 式 (6-50) 代 入 上 式 , 得 


V (x)—=xT CATPH PA (6-54) 
今 
A P+i+PAQ=—0 (6-55) 
式 中 0 为 正定 实 对 称 常 阵 , 则 李 雅 普 诺 夫 孙 数 的 导数 
V(x)=—x'Oxr<0 (6-56) 


因此 , 按 式 (6-55) 选 择 正定 常 阵 已 和 @, 可 以 保证 闭环 系统 (6-50) 的 渐 近 稳定 性 。 
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由 式 (6-53) 和 (6-56) ,可 得 
x Ox 一 一 和 (x Px) (6-57) 
将 式 (6-57) 代 入 性 能 指标 (6-51) ,得 
/= 六 | 一 下 CrPz)d: 一 xT(o0)Px(o0) 二 xT(0) Px(0) 


由 于 闭环 系统 (6-50) 渐 近 稳 定 , 必 有 x(ece) 一 0。 于 是 ,问题 6-3 的 次 优 性 能 指标 


7 一 了 xzT(O)Px(0) (6-58) 
次 优 控制 
u(t)=— Ky()=— KCxC) (6-59) 
式 中 P 和 kK 满足 李 雅 普 计 l 夫 方程 (6-55), 即 满足 
(A—BKC)TP+P(A—BKC)=— (QO+CT™KTRKC) (6-60) 


在 李 雅 普 庄 夫 方 程 (6-60) 中 ,由 于 P 和 外 均 为 未 知 值 , 故 无 法 直接 解 出 PP 入 。 可 以 
及 用 梯度 速 降 法 ,由 式 (6-60) 解 出 用 外 表示 的 P, 即 PC(K), 代 入 次 优 性 能 指标 (6-58), 得 
J"(K) ,然后 令 


9J°(K) 
ok 


可 以 找到 使 7" 极 小 的 K 值 。 从 而 求 得 P 值 。 
应 当 指 出 ,这 样 求 得 的 输出 反馈 增益 阵 的 优化 参数 ,必然 与 初始 状态 x(0) 有 关 。 
例 6-2 设 系统 动态 方程 
Ti1(t)=z2(t), Xz1(0)=1 
Zaz(t) 一 一 Zoo(t) 十 xi， zz(0) 一 0 
y(t) = z(t) 


一 人 (6-61) 


性 能 指标 
于 | [zx (十 (ED 十 2 (2) jdi 


已 知 zz(t) 无 法 测 取 ,要求 采用 输出 反馈 方法 , 求 出 反馈 矩阵 天 ,使 性 能 指标 极 小 。 
解 ”本 例 为 输出 反馈 次 优 调节 器 问题 。 按 题 意 
O 1 O 
4=| ， -| a=| |; C=[1 0], 0=1,, R=!1 
不 难 验 算 , 系 统 是 完全 可 控 且 完全 可 观 的 。 因 为 
A=A—BKC=| ”| | 
—k 一 1 
加 韦 0 
0 


QO=0O+C'K'RKC= | 


| 
令 对 称 常 数 抢 阵 
Pl Pr 
网 ,| 
则 由 李 雅 普 诺 夫 方 程 (6-55) 得 
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2kp1s=1+Tk° 
pu — pis— kp2z = 0 
2 (p12— P22) 二 一 ] 


解 得 
1 十 & 十 2 有 2 十 如 1 十 外 
2k 2k 
P= 
lk’ ] 十 到 十 下 
2k : 2k 
于 是 
。 上 工 T _ 1 十 kh 十 2k 十 
J°= 2 (0)Px(0)= 1 
令 
aJ° (Rk) 1 2 
py 一 本 (2 十 2 k “)=0 


解 得 & 一 0.565。 从 而 ,次 优 控制 
u(t)=—0.565y()=—0.565z1(t) 


次 优 性 能 指标 
[10% 1074] 
11.1674 1.6674 
J°=1. 0548 
闭环 系统 
CO 一 | xl) 
—0.565 一 1] 


其 特征 值 履 ,:= 一 0.5 士 j0.5613。 闭 环 系统 确 是 渐 近 稳定 的 。 
夺 xX2(t) 可 以 测 取 ,根据 定理 5-5 和 定理 5-6, 用 状态 反馈 方法 ,不 难 求 得 最 优 控制 
2 (1)=—0,.25z1(t)— zx; (7) 
最 优 性 能 指标 
J =0.125 
最 优 闭环 系统 
一 0.25 0 Be 
一 ] 


其 特征 值 A 二 一 0. 25 ,二 一 1。 闭 环 浙 近 稳定 。J < 过。 


6.2 离散 输出 调 方 大 


右 线 性 离散 系统 完全 可 观测 , 则 离散 输出 调节 器 问题 可 以 转化 为 离散 状态 调节 器 问 
题 来 处 理 。 本 节 将 给 出 线性 二 次 型 离散 输出 调节 器 最 优 解 的 形式 及 其 求解 步骤 。 
问题 6-4 设 线 性 离散 系统 的 状态 方程 及 输出 方程 为 
xCk+1)=ACRIxXE) BRUuR), X(CO0) 一 Xo (6-62) 
yk)—=CCEI rE) (6-63) 


+() =| 


k=0,1,.…,N—1 
式 中 x(%) 为 n 维 状态 向 量 序列 ;wu(8) 为 m 维 控制 问 量 序列 ,日 不 受 约束 ;y(8) 为 ! 维 输出 
向 量 序列 ,0</ 委 ms 及;4() BC) CCE) 为 维 数 适 当 的 和 矩阵 序列 ,其 各 元 连续 有 界 。 性 能 
指标 


一 1 
J=3y FN) +E Dy AQ YR 十 arCCDORCADaCD] (6-64) 


式 中 下 为 对 称 非 负 定 权 和 矩阵 ;OCR) 和 RG) 分 别 为 非 负 定 与 正定 对 称 权 和 矩 阵 序 列 ;F 
CC(k)、R(E) 的 维 数 适当 。 要 求 一 最 优 控 制 序列 w" (k) ,二 0,1,… ,NN 一 1, 使 性 能 指标 (6-64) 
极 小 。 : 

可 以 证 明 , 如 果 系 统 (6-62)、6-63) 完 全 可 观测 ,其 最 优 解 的 形式 与 离散 状态 调节 器 
问题 的 结论 类 似 , 最 优 控制 律 仍然 是 状态 x(%) 的 线性 蚂 数 。 

定理 6-4 对 于 有 限时 间 离 散 输出 调节 器 问题 6-4, 若 阵 对 (4(&),C(GE) 完全 可 观 , 则 
存在 唯一 的 线性 状态 反馈 最 优 控制 序列 


zw (RE) 一 一 民 (E)x(R)， 一 0, 1 N 一 1] (6-65) 
最 优 性 能 指标 | z 
J"* [x00) 0] 一方 xzT(O)PCO)x(0) (6-66) 
式 中 反馈 增益 矩阵 序列 
K(k)={(B' OEPETIBE) TH RE) 1 IBTOEIPOE1)ACE) (6-67) 
而 P(%) 是 离散 黎 卡 提 方 程 


P(Ek)=—=[AC(k)— BOEROKRCGE) PEI)LACGR)— BCE)KCE) | 
K(kORCEK CE) HC (RO CRICCE) 
: k=0,1,.…,N—1 (6-68) 
及 其 边界 条 件 
P(N)=CT(N)FCCN) (6-69) 
的 对 称 非 人 负 定 解 。 
证 明 将 输出 方程 (6-63) 代 入 性 能 指标 (6-64) ,得 


和 一] 
J— Fx NPCN) + DLxT CA)Q xk) Hu RR uCE)] 
下 一 0 


式 中 
FI=C (N)FC(N) 
Q1(k)=C (ROCRICCE) 
因 {4(k),CCE)} 完 多 可 观 , 必 有 CC) 关 0,k 二 0,1,…,N 一 1, 且 因 F 和 QC%) 对 称 非 负 定 ， 
故 F' 与 Q1(%) 为 对 称 非 负 定 和 矩阵。 根据 定理 5-10, 本 定理 全 部 结论 成 立 。 
离散 输出 调 市 器 的 结构 图 如 图 6-4 所 示 。 
离散 输出 调节 器 的 黎 卡 提 方 程 求解 ,与 离散 状态 调节 器 问题 一 样 ,可 采用 逆向 递 推 方 
法 进行 。 将 (4) 的 表达 式 (6-67) 代 入 歼 卡 提 方 程 (6-68) ,可 得 
P(Ek)=C (RIOC(RICCOE) TA RIPOETIACR) — AT(RIPCETIBGE) 。 
[B' (RPCOR+I)BOE)+ROE) BT RIPCE 1)ACE) z (6-70) 
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图 6-4 离散 输出 调节 器 结构 图 


今 
Z1(k)=CT (RORICCE) AT CD)P(R 十 1)4(R) (6-71) 
Z,(k)=B' (Ek)P(ET1)ACE) (6-72) 
Zs3(k)=RE)BT EP(EH1) BE) (6-73) 
则 有 : 
K(k)=2Z3 (k)Z,(k) (6-74) 
P(Ek)=Z1(k)—Z2 (Rk)Z3 "(Rk)Zs Ck) (6-75) 


于 是 ,可 按 如 下 步骤 求解 离散 输出 调节 盘问 题 ， 
Ju 检验 系统 的 可 观 性 。 


若 为 时 变 离散 系统 ,应 有 
rankLC (0) @® (1,0C C1)@® (CN—1,0C CN 一 1) =n (6-76) 
式 中 
ACk—1)A(kR—2):…A(0), k>0 
及 (k,0)= (6-77) 
7， k=0 
为 离散 状态 转移 和 矩阵。 
若 为 定常 离散 系统 ,应 有 
rank[C' A™C (4 DC 04) C=n (6-78) 


如 果 式 (6-76) 或 式 (6-78) 不 成 立 , 表 明 离 散 最 优 输出 调节 胡 无 解 ; 否 则 转 下 步 、。 
@) 令 & 一 入 , 按 式 (6-69) 计 算 P(N)。 
@) 邻 有 = 入 一 1, 按 式 (6-71) 一 式 (6-75) 计 算 Z1(k)、2Z,(&)、ZsC(k)、K(k) 和 PC(k)。 
由 符 有 一 上 一 1 之 0, 则 回 到 他 ) ,否则 转 下 步 。 
@) 按 式 (6-65) 和 式 (6-66) 计 算 w* (E) 和 .1[Lxz(0),0]。 
例 6-3 已 知 一 阶 离散 系统 
立 ( 有 十 1) 一 工 (R) 十 2x(R) 
y(k)=27r(k) 
试 求 最 优 控 制 序列 {u* (0) ,xz (1),x (2)}), 使 性 能 指标 


J= > [yk)+ru: (kg)], r>0 


极 小 。 
解 ” 本 例 为 定常 离散 输出 调节 器 问题 ,可 用 离散 输出 调节 器 方法 、 离 散 动态 规划 及 离 
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散 极 小 值 原 理 求解 ,三 种 方法 所 得 的 结果 完全 相同 。 由 题 意 :N= 二 3,4 二 1,B==2,C 一 2, 二 0， 
Q 二 1,R 二 rr。 显 然 , 系 统 完全 可 观测 。 
1) 离散 输出 调节 器 方法 。 
中 令 上 =3, 得 P(3)=CT(3)FC(3) 二 0。 
@ 令 上 二 2, 算 得 
Zi (2) 一 CT(2)0O(2)C(2) 十 4T(2)P(3)4(2) 一 4 
2Z,.(2)=B'(2)P(3)A(2)=0 
2Z3(2)=RC2)++B (2)P(3)B(2)=r 
K(2)=23'(2)2,(2)=0 
P(2) 一 Z, (2) 一 Z (2) 天 (2) 一 4 
(3) 令 &=1 ,算得 Z (1) 王 8,Z:01) 一 8,Z:01) 一 rr 十 16, 开 (1) 一 8/(Gr 十 16),PC1) 一 8(C 
十 8)7/(r 十 16) 。 
4) 令 4&=0, 算 得 Z(0)= 一 (12r 十 128)/(Gr 十 16),Z: 00) 一 16(r 十 8)/(Gr 十 16),Z, (0) 一 
(7 十 48r 十 256)/(r 十 16),K(0)==16(r 十 8)/[ (ry 十 16): 十 16r]。 


127* 十 4487* 十 5120r 十 16384 


?0)= 十 647? 十 1024r 十 4096 


3) 计算 最 优 控制 序列 
16Cr 十 8) 


xz (0)=—K(0)x(0)= HG Hire) 
; | 8 
uw (1)= K(xC1)= 二 16Z(T) 


zx (2)=—K(2)x(2)=0 
2) 离散 动态 规划 方法 。 将 系统 输出 方程 代 人 性 能 指标 ,得 


2 
J 一 >，[4z2(&) 十 ru2(R)]， r>0 


(DD 求 w* (2)， z 
J Lz(2) =min{4z (2)+ru’ (2) + LzC3)] 
式 中 Je [zx(3)] 二 0。 令 和 


了 一 2ru(2) 一 0 
得 
zt (2)=0, Ji[zx(2) |]=47x(2) 
(2) 求 ww* (1)。 : 
Ti [Lz(1) J]=min(4z(1)+ru’ (1)+J? [Lz(2)]) 
一 mint4z (1)+ru (1)+4[z(1)+2u(1)]) 
oa4.} 


了 5 一 2rxw(1) 十 16z(1) 十 32w(1) 一 0 


2 并 8 
得 2 (1)= FTEZ(1) 
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8 (一 十 24r 十 128) ， 


2 [LzC1L) 一 THI) 7 (1) 


(3G) 求 uw* (0)。 
16(r 十 8) 
(7 十 16) 十 167 


127" 十 4487r* 十 5120r 十 16384 
”3 十 6472 十 10247r 十 4096 


uu (0) 一 一 rx(0) 


六 一 /3 [Lz(0)]= Z (0) 


3) 离散 极 小 值 原理 方法 。 
ZE 十 1) 一 ZERD) 十 2xCR) 


2 
J= DL4r: Ck)+ru (8)], r>0 


未 端 x(3) 自 由 。 令 哈密 顿 函数 
五 (&) 一 4Z (Rk)Tru (Ek)TACETI) rk) uk) | 


因为 
DEC 
A(k)— rk) 一 8Z(A) 十 ART 十 1) 
CR) 加 
Fh) 一 27w(A) 十 2A( 十 1) 一 0 
99 _ 
443) 一 可 73 一 0 
所 以 有 
wu (h) 二 一 二 4A( 十 1) 
即 : 
， 1 
2 ”( 0) 一 一 一 A4(0] ) 
Fi 
， 1 ， 
2 (1]) 一 一 一 人 (CC2 ) 
u" (2)= 一 二 A(3) 一 0 
以 及 
A(kT1)=AaA(R)— 8r(k) 
即 
A(3)=A(2)—87x(2)=0， AC2) 一 8xr(2) 
A(2)=A(1)—8z(1), AL) 一 8Lz(2) 十 z(1) | 
A(1)=A(0)—8z(0), MAC0) 一 8[Lz(2) 十 z(1) 十 z(0)] 
由 状态 方程 


z(1) 一 (0) 十 2u(0) 一 z(0) 一 全 [xz(2) 十 z(1) 


zr(2)=z01) +2u1) = x1)— lrc2) 


rr 


rz(3)=7x(2)T2u(2) = rx(2) 
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整理 得 


(2)=— x7(1), 4(2)= zx(1) 


-+416 1 


rr 十 16) (0), Ady lr(r+8) co) 


TT F167 + 1 C+16) 167” 


于 是 
16C7 十 8) 


HG HIG 


z(1),0| 


wu (hb)=|— 一 二 二 


6.3 跟踪 系统 


跟踪 系统 问题 ,是 要 求 选择 一 控制 律 ,使 系统 的 实际 输出 跟踪 希望 输出 轨 线 ,并 使 规 
定 的 性 能 指标 极 小 。 实 际 上 ,调节 器 问题 是 一 种 特定 的 跟踪 系统 问题 , 即 零 轨 线 的 跟 踩 回 
题 。 本 节 讨 论 线性 系统 .二 次 型 性 能 指标 的 最 优 跟 踪 问 题 , 利 用 极 小 值 原理 推 证 有 限时 间 
与 无 限时 间 跟 踪 系 统 的 最 优 解 。 


6.3.1 有 限时 间 时 变 跟 踪 系 统 


问题 6-5 已 知 线性 时 变 系 统 的 动态 方程 
(1 一 ACECt) 十 至 (t)PCt) ， x(to)=xo (6-79) 
y(t)=C() .x(t) (6-80) 
式 中 xGQ)ER';wu(t)ER”", 且 不 受 约 束 ;yQ) ER',0 过 /之 m 研 n; 和 阵 A4(z),BG)、C() 维 数 
适当 ,其 各 元 连续 且 有 界 。 
设 y(t) 表 示 /! 维 希 望 输出 向 量 , 定 义 误差 向 量 


el(t)—= y(t)— y(t) (6-81) 
要 求 确定 最 优 控制 (2) ,使 系统 输出 y(t) 跟 随 希 望 输出 y,(1) ,并 使 性 能 指标 
J = eT (i) Felty) + 二 于 | Le dQ et tu HRA) Jd (6-82) 


为 极 小 值 。 其 中 ,末端 时 刻 tj 固定 ;F 为 1X 维 对 称 非 负 定 常 阵 ;QC) 为 1XLl 维 对 称 非 负 
定时 变 矩 阵 ;RG) 为 mXm 维 对 称 正定 时 变 和 矩阵 ;OC) 与 RC) 的 各 元 在 Lto,ty 区 间 上 连续 
且 有 界 。 
知 将 输出 方程 (6- g0) 代 人 误差 向 量 定义 (6- 81), 可 得 
e(t)—=y(t)—C)x() (6-83) 
表明 误差 向 量 可 用 希望 输出 向 量 和 状态 向 量 来 表示 。 将 上 式 代 和 人 (6-82), 可 得 用 x (2)， 
zi 和 (表示 的 性 能 指标 


一 可 [yi CG x 下 [mmGr) 一 CCGr)rGtr) 


+ 到 | {Ey -CO TD TD COD IT Ru Yd (6-84) 


应 用 极 小 值 原理 ,可 以 推 证 使 性 能 指标 (6-84) 为 极 小 值 的 必要 和 条件。 由 于 所 研究 的 是 
线性 二 次 型 问题 ,因此 可 以 证 明 , 极 小 值 原 理 给 出 的 必要 条 件 也 是 充分 的 ,其 证 明 过 程 类 
似 于 定理 5-1 ,不 再 蒙 述 。 
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定理 6-$ 对 于 有 限时 间 时 变 跟 踪 系 统 问 题 6-5 ,者 阵 对 {4G) ,CG)} 完 全 可 观 , 则 存 


在 唯一 的 最 优 控制 
& (t)=—R (GB (CD)[LPCDXCD) 一 BC) 
式 中 PL) 为 nXn 维 对 称 非 负 定 实 矩阵 ,是 下 列 黎 卡 提 和 矩阵 微分 方程 
—P(t)=P()A()+A' (PU) 
—POBGR GB GPG)+C GOUCG) 

及 其 边界 条 件 

P(t/)=C (tPFC (Ey) 
的 唯一 解 ;g (1) 为 n 维 伴随 向 量 , 满 足下 列 向 量 微分 方程 ， 

gD)=[A0) BR CB (PO)) g(t) HC (QC y, 0) 

及 其 边界 条 件 : 

g(tr)=C (t/) Fy lt/) 
最 优 跟 踪 闭 环 系 统 

X(t)=[ AG)—BOR OB CPG) XGO) HBG)R '()BT g(t) 
满足 初始 条 件 
X(to) 一 Xo 
的 解 ,为 最 优 轨 线 x* (1)。 
证 明 令 哈 密 顿 函数 


H = 3[y (2 —COXGE) TO Ly CG) —CO rx) 


TFuT Ru tx CAT G2) +uT CG) BT OA CE 
式 中 4 (z) 为 nX1 维 拉 格 朗 日 习 子 向 量 。 


由 极 值 条 件 
SROu) + BT (4)=0 
得 
u’ (1)=—R (BG)A GG) 
因 
2H 
J —R(1)~0 
所 以 式 (6-94) 表 示 的 wu*G) 可 使 五 极 小 。 
由 正则 方程 
.r,s~,__9H -1 T 
X= Tx BR (2)B (£2)A (4) 
oF ~ 下 
A (j= 一 C CCOCUDICCXCD 一 4 DAOC GOG) YY) 
今 
A(t)=P()x()— g(t) 
其 横 截 条 件 


(6-85) 


(6-86) 


(6-87) 


(6-88) 


(6-89) 


(6-90) 


(6-91) 


(6-92) 


(6-93) 


(6-94) 


(6-95) 


(6-96) 


(6-97) 
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A (tr) 一 e' (ty)Felts) ) 一 Cr)FCGDXCD) 一 CCtr)Ry tr) (6-98) 


9 | 
ax(t:)|2 
将 式 (6-97) 两 端 对 上 求 导 ,得 
4A(t) 一 PC)XCD) 十 已 () 天 (zt) — g(t) (6-99 ) 
将 式 (6-97) 代 入 式 (6-95), 有 : 
X(t)=LAC()—BOR (0)B (PO) x)+BOOR (2)B C(t)g(t) (6-100) 
将 式 (6-100) 代 入 式 (6-99) ,整理 后 得 
A(C()=[EPG)+PG)AG)—PG)BOGR 1()B' (PC) |xC) 
PO)BOGR (0)B (g(t)—g() (6-101) 
同时 ,将 式 (6-97) 代 入 协 态 方程 (6-96) ,得 
AC)=[E—C GOCE —ATOPG) Ix) A Tg HCTOOG yy) (6-102) 
只 要 最 优 解 存在 , 式 (6-101) 和 (6-102) 对 所 有 的 xG) 和 yi) 都 应 成 立 。 因 此 ,nXn 和 矩阵 
P(2) 必 满足 黎 卡 提 方 程 (6-86) ;n 维 列 向 量 gG) 必 满足 向 量 微 分 方程 (6-88)。 其 边界 条 件 
可 由 式 (6-97) 和 (6-98) 推 得 。 
在 式 (66-97) 中 , 令 上 一 上 ,有 
Atr) 一 Ptr)ZCtr) 一 PCtr) (6-103) 
式 (6-103) 与 横 截 条 件 (6-98) 相 比 ,可 知 边 界 条 件 (6-87) 和 (6-89) 成 立 。 
因 {(4(2) ,CGQ)}) 完 全 可 观 , 故 CG) 关 0,VY 1€E[Ltostij; 生 已 知 F 宇 0,; 所 以 PGy) 守 0, 从 而 
PC 之 0。 
因为 PQ) 及 8) 均 可 解 , 所 以 将 式 (6-97) 代 人 式 (6-94) ,得 最 优 控制 
u* (1) 一 一 RGBTCGDI[TPCGDx(GD) 一 g(Ct)] (6-104) 
将 式 (6-104) 代 和 人 状态 方程 (6-79) ,可 得 最 优 闭环 系统 (6-90)。 因 为 式 (6-90) 满 足 极 
小 值 原理 的 必要 条 件 , 故 其 在 初始 条 件 (6-91) 下 的 解 ,一定 是 最 优 轨 线 x* (i) 。 
关于 到 (2) 的 唯一 性 以 及 P(z) 的 对 称 性 和 唯一 性 ,是 显然 的 。 
对 于 定理 6-5, 有 如 下 几 点 说 明 。 
1) 最 优 跟 踊 系 统 的 反馈 结构 与 希望 输出 无 关 , 和 最 优 输出 调节 器 的 反馈 结构 相同 。 
式 (6-104) 表 明 , 最 优 跟 踪 系 统 的 控制 律 由 反馈 项 一 R71G)BTG)PG)xG) 以 及 前 馈 项 
R-1(1)BT(4)g() 构 成 。 黎 卡 提 方 程 (6-86) 及 其 边界 条 件 (6-87) 均 与 y,(t) 无 关 , 因 而 PG) 
与 希望 输出 无 关 。 将 式 (6-86)、(6-87) 与 有 限时 间 最 优 输出 调节 器 定理 6-1 中 的 式 (6-9)、 
式 (6-10) 相 比 ,发 现 它们 完全 相同 , 故 其 反馈 结构 相同 。 
2) 最 优 跟 踊 系 统 的 闭环 特征 值 ,与 最 优 输出 调节 器 的 闭环 特征 值 相同 ,因而 跟踪 系 
统 的 动态 性 能 也 与 希望 输出 无 关 。 
将 式 (6-100) 与 定理 6-1 中 的 式 (6-8) 相 比较 可 知 , 其 闭环 系统 矩阵 完全 相同 ,因而 闭 
环 特征 值 必 相 同 。 由 于 闭环 系统 矩阵 与 希望 输出 无 关 , 而 系统 动态 性 能 仅 取决 于 其 特征 
值 , 己 外 加 激励 函数 无 关 , 故 动态 性 能 与 希望 输出 无 关 。 
3) 最 优 跟踪 系统 中 伴随 系统 的 动态 性 能 与 希望 输出 无 关 。 
最 优 跟踪 系统 与 最 优 输出 调节 器 系统 的 主要 差别 反映 在 向 量 g(2) 上。 比较 式 (6-88) 
和 式 (6-90) 可 见 , 它 们 的 齐 次 部 分 正好 互 为 负 的 转 置 矩 阵 , 因 此 式 (6-88) 称 为 式 (6-90) 的 
伴随 方程 。 若 令 更 〈t,zo) 是 式 (6-88) 的 转移 矩阵 ,@ (z,t) 是 式 (6-90) 的 转移 矩阵 , 则 有 下 
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州 天 系 式 \ 
BU) (Gt) = (6-105) 
或 者 说 ,伴随 系统 (6-88) 的 特征 值 ,是 闭环 系统 (6-90) 特 征 值 的 负数 。 因 而 ,伴随 系 
统 (6-88) 的 动态 性 能 也 和 和 希望 输出 无 关 , 和 希望 输出 y,(1) 可 以 看 作 是 伴随 系统 的 激励 孙 
数 , 用 以 激励 信号 g (2)。 
4) 最 优 控 制 的 现在 值 与 希望 输出 的 将 来 从 有 关 。 
对 于 伴随 系统 (6-88), 设 g(t) 为 现在 值 , 罗 (t,t) 为 转移 矩阵, 则 有 


gt/)=C CFy (ty)= (Gt) g(t) -| Bir)C (rT Or yr)dr|] (6-106) 


于 是 
g() = crD8GD 十 | -1 CT OQ) yd (6-107) 


趟 《6-107) 表 明 , 为 了 计算 glz) 的 现在 值 ,必须 已 知 希望 输出 y,(2) 在 [t,tyj 区 间 上 的 全 部 
”将 来 值 。 由 于 最 优 控制 律 表达 式 (6-85) 中 包含 gQ) 的 计算 , 故 计算 最 优 控 制 u* (1) 的 现在 
值 ,必须 知道 希望 输出 y,() 的 全 部 将 来 值 。 

一 般 来 说 ,希望 输出 往往 难以 事先 确定 ,因而 在 设计 最 优 跟踪 系统 时 ,可 以 采用 两 种 
方法 处 理 :一 种 是 把 希望 输出 看 成 某 种 典型 的 变化 规律 ; 另 一 种 是 把 希望 输出 看 成 随机 信 
号 。 在 前 一 种 情况 下 ,系统 的 工作 性 能 取决 于 希望 输出 的 实际 值 与 预定 值 的 符合 程度 ;在 
后 一 种 情 次 下 ,系统 的 工作 性 能 在 平均 意义 下 最 优 ,但 不 能 保证 在 任 一 次 试验 中 ,系统 的 
啊 应 都 是 满意 的 。 

5) 关于 PG) 和 g(4) 的 计算 问题 。 

由 于 PQ) 与 希望 输出 及 初 态 无 关 , 故 可 离线 算出 PC) 在 t€ [zir] 上 的 全 部 值 。 知 道 
PC 和 和 (9 以 后 ,可 以 利用 边界 条 件 (6-89) 闭 时 间 求 解 式 (6-88) ,也 可 以 利用 下 式 ， 


g(to)= t,t)C (Eye 人 tr) +| (t,t0)OC (tO (rT) yr dr (6-108) 


顺 时 间 求 解 式 (6-88) ,得 到 伴随 向 量 g(t)。 
有 限时 间 最 优 跟踪 系统 的 结构 图 ,如 图 6-5 所 示 。 
例 6-4 已 知 一 阶 系统 的 动态 方程 为 
T(t)=az(t)+ult), xX(0)= zo 


yt 一 工人 起) 
Bl) . X(to) 
pn, 一 00) 1) xD 
一 一 | CC (DOD 一 人 盖 一 站 到 了 BR (DB ) 一 -一 CD | -一 四 二 
| 一 ~ 
| 天 = z UL 


[BCOR:(DOBTDPC|e LL) BOY(DBDPOn 


图 6-5 有 限时 间 最 优 跟踪 系统 


控制 蚂 数 &0) 不 受 约束 。 用 y( 拉 表示 希望 输出 ,误差 方程 是 
el =I0)— y=50) zr) 
要 求 最 优 控 制 w" (4) ,使 性 能 指标 
J 二 示 fer(4)) 一 | [ee 人 十 ra2C]di 


极 小 。 其 中 J 之 0,09 盖 0,7r 一 0。 
解 ”本 例 为 有 限时 间 定 常 跟踪 系统 。 显 然 , 系 统 可 观 。 最 优 控制 律 


u* (1)=—[p() zt) —g0)] 
式 中 p (4) 满 足 
$0)=—2ap() + p(t) —q, p(t)=f 
8g (zt) 满足 
, ] ~ ~ 
8(D)=—|a—ip() lg(t)—gye), g(t7)=f ys) 
最 优 轨 线 zx* GG) 满足 
z=—|a—zp() |z() + lgd), z(0)=z, 


QD 最 优 阶 路 跟踪 响应 , 取 yG) 二 1() ,系统 参数 .a= 一 1 ,f= 二 0,g 二 1,tj=1,x(0) 二 0 
最 优 跟 踊 系统 啊 应 曲线 如 图 6-6 所 示 。 其 中 ,图 6-6(a) 表 明 , 当 g 一 定时 ,r 减少 可 提高 输 
出 跟 踊 能 力 , 但 由 于 无 终点 指标 要 求 , 在 接近 终端 时 ,控制 趋 于 零 ,以 至 于 跟踪 误差 加 大 。 
6-6(b) 表 示 伴 随 量 的 响应 ,r 越 小 ,g (4) 的 起 始 段 越 平坦 ,在 i 较 小 时 ,g() 可 视 为 常量 ， 
图 6-6(c) 表 示 控 制 zx 人 (的 变化 曲线 ,> 越 小 ,u(tz) 变 化 越 大 ;在 终点 处 ,u(ty)=0, 这 就 是 在 


终端 时 跟踪 误差 反而 增 大 的 原因 。 


(2 积分 系统 的 最 优 阶 跃 跟踪 响应 。 取 >(t) 王 1G) ,a 二 0, 其 他 参数 不 变 。 此 时 ,系统 成 
为 纯 积 分 系统 ,其 阶 跃 最 优 跟 踪 响 应 如 图 6-7 所 示 . 由 图 可 见 ,在 接近 终端 时 ,系统 的 跟踪 


误差 并 不 增 大 ,这 是 由 于 系统 的 积分 特性 决定 的 。 


(3 开 环 不 稳定 系统 的 阶 跃 跟踪 响应 。 取 3(2) 二 1(4) ,a 二 十 1, 其 他 参数 不 变 。 此 时 , 开 
环 系 统 不 稳定 , 阶 跃 跟踪 响应 如 图 6-8 所 示 。 由 图 可 见 , 当 接近 末端 时 刻 tj 时 ,输出 y() 


(1 
1.0 


0.5 


r=1 


(a) (b) 
图 6-6 ”最 优 跟踪 系统 响应 曲线 


* 216*« 


图 6-7 ”最 优 跟 踪 系 统 (a 王 0) 啊 应 曲线 


仍 趋向 于 希望 输出 y() ,但 会 产生 负 的 终端 跟踪 误差 ; 当 > 一 0. 01 时 ,最 优 控 制 函 数 <(t) 
有 一 段 负 值 ,以 对 付 不 稳定 性 ,使 跟踪 误差 保持 在 较 小 的 值 上 。 
2(D) ul(D) 


0.5 


(a) (b) 


图 6-8 跟踪 系统 (ae 王 十 1) 响 应 曲线 


由 积分 系统 的 方 波 跟踪 响应 。 取 系 统 参数 .a 一 0,f 二 0,g 二 1,t/ 二 5,X(0) 二 1。 希望 输 
出 函数 取 为 
~ 0， 0 和 上 <2. 5 
y(t) 一 |， 2 5<ci<5 0 (6-109) 
最 优 方 波 跟 踪 系 统 的 响应 如 图 6-9 所 示 。 其 中 ,图 6-9(a) 表 明 , 当 r= 二 0.01 时 ,系统 跟踪 性 
能 较 好 ,在 :1€10,1.5j 区 间 , 系 统 工作 情况 类 似 于 状态 调节 紫 , 系 统 性 能 预测 即将 有 阶 唉 
信号 到 来 ,因此 系统 输出 在 t= 二 2 时 就 开始 增长 ,这 样 当 :二 2.5 阶 跃 信号 输入 时 ,输出 变 
量 迅 速 上 升 到 希望 输出 值 ,使 得 1 汪 2.5 时 的 跟踪 误差 较 小 ; 当 r==1 时 ,系统 的 跟踪 性 能 
明显 变 坏 。 图 6-9(b) 表 示 伴 随 量 g(b 的 变化 情况 , 当 >=0.01 时 ,在 上 0 到 上 大 约 为 2 的 
一 段 时 间 区 间 内 ,g( 纪 一 0, 表 明 此 时 系统 工作 于 调节 器 状态 。 
@ 积分 系统 的 正弦 跟踪 响应 。 取 系统 参数 同 由 。 和 硕 望 输出 函数 取 为 
y(t)=2sin4t, 1€[0,5] (6-110) 
最 优 正弦 跟踪 系统 的 响应 如 图 6-10 所 示 。 由 图 可 见 , 当 r= 二 0. 01 时 ,系统 的 跟踪 性 能 较 
好 ;而 当 r==1 时 ,系统 的 跟踪 性 能 极 差 。 
以 上 多 次 计算 结果 表明 :最 优 跟踪 系统 性 能 指标 中 的 权 阵 选取 ,对 系统 性 能 的 影响 极 
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图 6-10 正弦 流 跟 踩 啊 应 曲线 


大 。 对 于 一 阶 跟 踪 系 统 , 误 差 量 的 权 系 数 g 应 选 得 比 控 制 量 的 权 系 数 ” 大 50 一 100 倍 , 可 
以 获得 较 好 的 跟踪 性 能 。 


6. 3.2 无 限时 间 定 常 跟 踪 系 统 


对 于 无 限时 间 跟 踪 系 统 问题 ,目前 还 没有 一 般 性 的 求解 方法 。. 当 希望 输出 为 定常 向 量 
时 ,无 限时 间 定 常 最 优 跟 踪 系 统 问 题 有 如 下 近似 结果 。 
定理 6-6 已 知 线性 定常 系统 的 动态 方程 为 
X(t)=AxC) TBu), x(0)=x, (6-111) 
y(t)=Cx(t) (6-112) 
式 中 x(1)E€ R";u(t)€ R”, 且 无 约束 ,y(t)E€ R',0<<! 人 mn;A、B\C 为 维 数 适当 的 常数 
和 矩阵。 
设 y 为/ 维 定常 希望 输出 常 向 量 ,e(4) 为 误差 向 量 ,由 下 式 定义 : 
el(t)=y,— y(t) (6-113) 
性 能 指标 


7 一 到 | [eT (Qe + 0) Rudt) jd (6-114) 


式 中 OQ 和 RR 均 为 对 称 正 定常 数 和 矩阵 。 
若 阵 对 {4,B} 完 全 可 控 , 阵 对 {4,C} 完 全 可 观 ， 则 近似 最 优 控制 
u(t)=—R-'B'Pr()+R Bg (6-115) 
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式 中 尸 为 对 称 正定 常 阵 , 满 足下 列 黎 卡 提 代 数 方程 : 


PA+A'P—PBR BTP+C OC=0 (6-116) 

常 值 伴随 疝 量 
g—=[PBR BT—A'] COy, (6-117) 

回 量 微分 方程 
X(t)— (A—BR BIPxXG)HBR Bg, x(0)=x, (6-118) 


证 明 ”由 于 {4,B}) 可 控 , 故 存在 稳 态 解 
P= limP()=const 
tip oo 
且 满 足 式 (6-116)。 
因为 {4,C} 可 观 , 必 有 PP 二 0, 设 终端 时 间 zj 为 相当 大 的 有 限 值 ,并 设 T 和 TT, 为 另外 
两 个 很 大 的 时 间 值 , 旦 满足 


0< 科 7 < 和 1 < 冬 1r< oo 
因为 i/ 全 T,, 所 以 对 于 所 有 t€EL0,T,], 可 用 稳 态 解 P 近似 代替 PG(), 即 
POOSP Yi€EL[O,T,)] (6-119) 
由 定理 6-5 ,最 优 闭环 系统 (6-90) 可 表示 为 
XC A—BR BPxX(G)TBR ‘Brig(), 1ELO,T, | (6-120) 
伴随 方程 (6-88) 可 表示 为 
g(t)— (A—BR BP)'g()—COy,, teELO,T,] (6-121) 
定义 下 列 和 矩阵 
G=A— BR !'B'P (6-122) 
S—BR-'BT (6-123) 
W=C'O (6-124) 
则 式 (6-120) 和 (6-121) 可 写成 
TUGIH) TH SgG), LtE[O,T,| (6-125) 
gE—G'g(t) —Wy, t€E LO0,T,] (6-126) 


{4,C} 可 观 可 以 保证 闭环 系统 (6-90) 渐 近 稳 定 , 即 
: ReA{G}<0,， i=1,2,-.…,n 
故 有 
ReA.{—G'}>0, 1 一 1 2 … 7 
因此 ,伴随 系统 (6-126)? 是 不 稳定 的 。 但 是 ,由 于 性 能 指标 式 (6-114) 中 无 终端 指标 ,所 以 由 
式 (6-89) 知 ,g(r) 一 0, 且 下 列 向 量 是 有 限 的 


gCTo) 一 | -i(r,T CTONdr#0 (6-127) 
对 于 线性 定常 伴随 系统 (6-126) ,状态 转移 和 矩阵 可 表示 为 
(Ts,t) =e ® 2 (6-128) 


设 glz) 为 现在 值 , 则 伴随 系统 (6-126) 在 7T, 时 刻 的 解 为 
(Ts 和 (Tt) [gc 一 | Wr-! Cr Whdr | 
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一 e-9 (Ts? gC) 一 | ‘ed eoWydr | , t€[0,T,] 
或 写 为 
g(t)Ae° Te ‘p(T,) 十 | ‘er eoWyidr, it€E [0,T,) 
由 于 WW 和 yy 分 别 为 常 阵 及 常 向 量 , 故 有 
| eroWjdr= | | ecrdr 
因为 Re4(G }<0, 故 (CD) 一: 存在。 根据 和 矩阵 指数 性 质 
| ‘ear= CD- 人 ecrdr= (GT™) -Teserr ecr 


T ~ 
e 人 ‘Wy, 


将 式 (6-132) 代 入 式 (6-131), 可 得 
i, 本 A 工 本 FP 
| e5 Wyidr= (GT™) er Tre-6 Wy,— (GT) -Wy, 


将 式 (6-133) 代 入 式 (6-130) ,并 利用 (GT)-: 与 ecm 乘 积 可 交换 的 事实 ,得 
gE— (GT) -Wyte [0(GT)-ie-9 Wy te g(T,)], 1Efo,T,)] 


当 
OTI<T,:, tt€EL[0,T] 
由 于 ReA{G }) 过 0,1 二 1,2,…,n, 则 由 引 理 6-2 惹 , 对 充分 大 的 了 T;,, 必 有 
ec Tau0 : 
于 是 , 式 (6-134) 进 一 步 近 似 为 
g(t SG—(G') Wy=g, 上 EL0,7 


(6-129) 


(6-130) 


(6-131) 


(6-132) 


(6-133) 


(6-134) 


(6-135) 


(6-136) 


式 (6-136) 说 明 , 当 上 较 小 时 ,伴随 向 量 g() 近 似 为 常 值 向 量 ;ztj.T) 及 T, 越 大 , 式 (6-136) 


近似 程度 越 高 ;只 要 ijy 取得 很 大 ,近似 式 (6-136) 有 足够 的 工程 准确 度 。 


将 近似 式 (6-119) 和 (6-136) 代 入 有 限时 间 跟 踪 系 统 的 最 优 控制 律 (6-85), 可 得 无 限 


时 间 跟 踪 系 统 的 近似 最 优 控 制 律 (6-115) 。 
无 限时 间 定 常 近似 最 优 跟踪 系统 结构 图 如 图 6-11 所 示 。 


图 6-11 定常 跟踪 系统 结构 图 


引 理 6-2 在 4 为 2X2a 维 实 常 阵 , 是 有 
Re44 <0， zz 一 1 2 7 


则 当 工 充分 大 时 ,有 


证 朋 不 失 一 般 性 , 设 A 有 各 异 特 征 值 hz 一 上 2， ,多 仔 在 非 奇 异 变 换 抑 阵 


P= [Lp bs 机 pj 
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式 中 pist=1,2 ,°° ;71; 为 特征 问 量 。 使 得 
A=P™'AP=diag {A ,Ns ,hh,) 


式 中 
Pi=[g: gqg: °* gg:]) 
因为 
(GsI—A) =diag{(s—A) ,Cs—A) Ys, (5—A) ) 
所 以 


e4 一 er t= TI—PAPT) = > Rie* 
i 二 1 
式 中 R= pg:AA0, ReA<=0,1=1,2,°" ,nNn。 
邻 1 二 TT, 且 了 充分 大 , 必 有 
e′ 一 > Re* 0 
例 6-5 设 系 统 动态 方程 
z(t) = —27r,(t) u(t) 


性 能 指标 


7 一 二 | [er() tw dt 


试 求 近似 最 优 控制 x(z)。 其 中 el2) 二 yy 一 y(2) ,yi 一 a( 常 数 )。 
解 ” 本 例 为 无 限时 间 定 常 跟 踊 系统 问题 。 由 题 意 


O ] 0 
if [ca or 
0 一 2 ] 


@ 检验 系统 的 可 控 性 与 可 观 性 。 


0 1 
rank[b Ab]=rank| ,|=2 


Cc 1 0 
rank| |=rank| |=2 
cA OO 1] 


故 系统 完全 可 控 、 可 观 ,近似 最 优 控制 20) 存在 


@ 求 户 并 检验 其 正定 性 。 $P=|, ' , “|, 由 式 (6-116) 不 难 求 得 
、 2. 45 1 
2-| 1 ,sj>。 


@ 求 常 值 伴随 向 量 8。 由 式 (6-117) ,得 


、 A 2. 45a 
g=(Pbr 'b'—A') 'C'ga= | | 
a 


@ 求 近似 最 优 控制 &(z) 。 
ult)=—r ib'Px() tr bg=— x (t)—0.45x(t)+a 
3) 检验 闭环 系统 稳定 性 。 由 式 (6-118) 得 闭环 系统 方程 


0 1 0 
x(D)=| om | 
一 一 2. 45 a 


求 出 闭环 系统 特征 值 : 久 二 一 0. 5175,As 二 一 1]. 9325。 闭环 系统 是 半 近 稳定 的 。 
习 是 


6-1 已 知 系统 动态 方程 
Zz1(t) = x(t) 
z(t) = ~ z(t) u(t) 
y(t)= zi(t) 


性 能 指标 
= 到 | [yD +) Jd 


试 构造 输出 调节 更 ,使 性 能 指标 极 小 。 
6-2 设 有 二 次 积分 模型 
Zi(t)=7z2(t), 7X1(0)=0 
Xz2(t)—=ult), zx2(0)=]1 
y(t) = z(t) 
性 能 指标 


J=| [yD) +40) de 


试 求 使 性 能 指标 极 小 的 最 优 控制 u* (7), 并 求 最 优 性 能 指标 J 。 
6-3 已 知 系 统 动态 方程 


0 l 0 
T(t) = | jt ju) 
一 1 一 3 ] 


y(t)=|1 0jxG) 
性 能 指标 


7=| [looy*a) 十 w(t) jdz 
0 


试 求 使 性 能 指标 极 小 并 使 闭环 系统 渐 近 稳定 的 最 优 控制 x* (4)， 
6-4 为 了 乘客 的 舒适 ,稳定 海轮 的 一 种 方法 是 采用 一 对 鳍 , 鳍 由 执行 元 件 控制 ,执行 
元 件 本 身 是 由 液压 马达 组 成 的 一 个 反馈 系统 。 已 知 控制 海轮 横 滚 运动 的 方程 为 
Job(GD 十 76CGD) 十 ag(t) 一 Ra 人 Ci) 
式 中 0(1) 为 模 深 角 , 可 以 测量 ， 并 可 用 来 反馈 ;ku(t) 是 由 鳍 产生 的 横 滚 力 矩 。 假定 ;a/J,= 
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0.3,7/2 MV aJo 二 0.1, 以 及 上 /a 二 0.05。 斌 设计 最 优 控 制 律 x* (2), 使 性 能 指标 
=| {100[0() —0(D T+ue jd 


极 小 。 式 中 0 为 希望 的 横 滚 角 , 恒 为 零 。 
6-5 试用 离散 极 小 值 原理 证 明定 理 6-4。 
6-6 设 完 全 可 观 线性 时 变 系统 
X(t)—=AC(xX Bu wt) 
y(2)=C( x) 
式 中 w() 为 一 已 知 扰 动向 量 。 设 zG) 为 希望 输出 ,定义 误差 回 量 
e(t)=z(t)— y(t) 
性 能 指标 


J=3e Fe) tz| [er (Qe Fu (Ru J 


式 中 FF 二 FF 之 0,00() 一 Q7() 宇 0,RG)==RTG)0。 试 证 明 最 优 控 制 为 
u’ (1)=R GB (eG)— POG)xG))| 
式 中 PQ) 满足 通常 的 黎 卡 提 方 程 及 边界 条 件 ,g(t) 满 足下 列 线性 微分 方程 : 
g(t)=—[AG)—BGR GB GPO) Ig —C GO0G)z() HP ww) 
及 其 边界 条 件 : 
g(t/)=C (ty) Fz(ty) 
6-7 设 系 统 动态 方程 为 

TX1(t) = z(t) 

z(t)=u lt) 

y(t) = xi(t) 
性 能 指标 


J=3| {fy T+) }dt 


式 中 希望 输出 y= 二 1G4)。 斌 求 近 似 最 优 控制 wu (4)。 
6-8 已 知 系 统 动态 方程 为 


Z(t) = z(t) 1 Ou(t) 
性 能 指标 
J=| {[yC 一 ] 了 十 iD }d 
试 求 近似 最 优 控制 x(t) 。 


6-9 设 有 一 理想 化 轮船 操纵 系统 ,其 从 激励 信号 u() 到 实际 航向 y(i) 的 传递 函数 
为 4/55, 试 设计 近似 最 优 激 励 信 号 x() ,使 性 能 指标 
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7 一 | [yn — p+) }d 


极 小 。 式 中 ,希望 输出 y 为 单位 阶 跃 函数 。 
6-10 设 用 控制 系统 可 以 目 动 地 保持 咨 艇 的 诛 度 , 淤 艇 从 艇 尾 水 平角 9(z) 到 实际 深 


度 y() 的 传递 隐 数 ,可 以 近似 为 
G(s)= 
试 设计 控 制 律 9() ,使 性 能 指标 
=| {fy -y+ }d 
最 小 。 其 中 希望 深度 w 王 100。 假 定 , 实 际 深度 可 用 压力 传感器 测量 ,并 可 用 于 反馈 。 


10(s 二 2): 
(s 十 10)(s* 十 0.1) 
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第 7 章 鲁 棒 最 优 控制 


近 30 年 来 ,最 优 控 制 理论 得 到 了 迅速 的 发 展 , 并 在 空间 技术 的 应 用 中 获得 了 巨大 的 
成 功 .然而 ,在 常规 的 工业 过 程控 制 中 ,特别 是 在 化 工 过 程控 制 中 ,最 优 控制 理论 并 没有 给 
人 们 理 来 期 望 的 成 功 。 这 主要 是 因为 各 种 阔 置 及 工业 过 程 均 运 行 在 变化 的 环境 中 ,温度 、 
压力 . 负 谷 .元 仑 件 参数 等 的 变化 以 及 执 动 的 存在 ,使 得 系统 的 数学 模型 具有 不 确定 性 ,要 
精确 地 对 一 个 实际 系统 建 模 是 不 可 能 的 。 客 观 实 际 建 模 的 不 确定 性 和 外 界 不 可 测 扰动 的 
存在 ,要 求 系统 具有 和 鲁 棒 性 , 即 系统 在 一 定 ( 结 构 、 大 小 ) 的 参数 摄 动 下 ,具有 维持 某 些 性 能 
的 特性 ，。 : 

近年 来 , 鲁 棱 控 制 已 成 为 控制 理论 和 应 用 的 重要 研究 方向 之 一 .要 使 常规 的 最 优 控制 
在 过 程控 制 等 领域 中 获得 更 广泛 的 应 用 ,取得 人 们 所 期 望 的 成 功 ,就 必须 研究 鲁 棒 控制 ， 
并 在 研究 最 优 控制 的 同时 ,考虑 系统 的 鲁 棒 性 。 


7.1 重 棒 控制 问题 


鲁 棱 控制 的 目的 是 要 寻求 一 种 反馈 控制 律 ,使 闲 环 系统 的 特性 (如 稳定 性 和 动态 性 
能 ) 不 受 建 模 误 差 和 不 可 测 扰 动 等 不 确定 因素 的 明显 影响 。 如 果 确 定 的 反馈 控制 律 不 但 具 
有 和 角 棒 性 ,而 且 可 使 某 一 性 能 指标 最 优 ( 或 次 优 ), 则 称 为 鲁 棒 最 优 ( 或 次 优 ) 控 制 。 

鲁 棒 控制 技术 的 发 展 大 体 上 可 以 分 为 两 个 阶段 。 第 一 阶段 ,大 约 从 1927 年 至 1975 
年 , 称 为 古典 鲁 棒 控 制 阶段 。 这 一 阶段 主要 考虑 系统 的 某 一 性 能 或 品质 对 系统 参数 变化 的 
灵敏 度 。1927 年 美国 Black 申请 的 专利 ”也许 是 最 早 提出 的 鲁 棒 控 制 方案 ,他 建议 利用 
局 增益 反馈 来 提高 具有 不 确定 性 对 象 的 控制 精度 ,但 按 这 种 方式 设计 的 系统 往往 导致 不 
稳定 。1945 年 ,Bode 等 人 提出 的 方法 解决 了 权衡 高 增益 和 动态 稳定 性 之 间 的 关系 ,引入 
了 微分 有 灵敏度 函数 来 分 析 系统 参数 摄 动 对 系统 性 能 的 影响 。 从 1927 年 至 1960 年 ,可 以 称 
为 灵敏 度 设计 时 期 ,主要 针对 单 变量 系统 的 稳定 性 .灵敏度 . 品 声 抑 制 等 进行 了 大 量 研究 。 

1960 年 至 1975 年 ,我 们 称 为 鲁 棒 控 制 技 术 第 一 阶段 的 状态 变量 时 期 。 在 这 一 时 期 
中 ,最 优 控 制 等 现代 控制 理论 获得 了 飞速 发 展 , 但 对 被 控 对 象 的 不 确定 性 缺乏 足够 的 重 
视 。 也 有 一 些 学 者 ,如 Cruz 和 Perkins ,于 1964 年 针对 多 变量 系统 的 分 析 ,提出 了 灵敏 度 
比较 窍 阵 的 概念 ,将 单 变量 系统 的 灵敏 度 郴 数 分 析 方 法 推广 到 多 变量 系统 。 此 后 ,人 们 发 
展 了 许多 基于 灵敏 度 分 析 的 设计 方法 ,提出 了 轨迹 灵敏 度 . 性 能 指标 灵敏 度 和 特征 值 、 特 
征 癌 量 灵敏 度 间 题 。Davison 提出 了 干扰 不 变性 内 模 原 理 , 可 以 研究 无 穷 小 扰动 对 系统 结 
构 稳 定性 的 影响 。 此 外 ,还 有 Zame 的 小 增益 原理 和 Kalman 关于 LQ 状态 反馈 控制 律 鲁 
棒 性 的 工作 ,使 系统 的 鲁 棒 性 分 析 和 设计 取得 了 显著 的 效果 。 

从 总 体 上 说 ,和 鲁 棒 控 制 技术 第 一 阶段 的 工作 主要 是 考虑 无 穷 小 摄 动 对 系统 的 影响 。 实 
际 上 ,系统 参数 是 不 能 视 为 不 变 或 仅 具 无 穷 小 摄 动 的 ,系统 工作 环境 的 改变 ,参数 的 变化 ， 
模型 的 不 精确 、 降 阶 近似 、 非 线性 因素 的 线性 化 等 , 均 可 等 效 视 为 一 种 参数 扰动 ,有 时 系统 
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的 工作 状态 也 要 发 生变 化 。 当 用 同一 控制 句 控 制 该 对 象 时 ,人 们 把 由 于 不 同 工 作 状态 所 对 
应 的 参数 差别 视 为 一 种 扰动 ,当然 ,这 种 参数 变化 只 能 视 为 有 界 扰 动 ,而 不 是 无 穷 小 扰动 ， 
从 而 促进 了 和 鲁 棒 控制 技术 的 发 展 , 使 之 进入 第 二 阶段 , 称 为 现代 和 鲁 棒 控制 阶段 。 

现代 和 鲁 棒 控 制 的 重要 任务 ,是 使 系统 在 有 界 参数 扰动 下 ,具有 性 能 保持 的 能 力 ,其 分 
析 和 研究 主要 集中 在 两 类 方法 上 ,一 种 研究 对 象 是 闭环 系统 的 状态 矩阵 或 特征 多 项 式 , 多 
来 用 代数 方法 研究 。 其 中 心 是 讨论 多 项 式 艇 或 矩阵 簇 的 稳定 性 问题 。 例如 ,在 给 定 多 项 式 
簇 或 矩阵 簇 后 ,从 系统 的 传递 函数 或 传递 函数 矩阵 出 发 ,判断 其 是 否 为 DD 稳定 簇 ;或 者 ， 
在 给 定 稳定 多 项 式 ( 或 矩阵 ) 后 ,在 其 所 在 空间 给 出 最 大 可 允 扰 动 界 ,研究 对 象 是 系统 的 传 
递 旺 数 或 传递 函数 矩阵 时 , 常 采用 频 域 的 分 析 和 设计 方法 。 这 类 分 析 和 设计 方法 与 工程 实 
际 结合 得 比较 好 ,如 ”方法 就 是 频 域 设 计 中 最 近 发 展 起 来 的 有 力 的 鲁 棒 设 计 工 具 。 下 面 对 
一 些 现代 鲁 棒 分 析 及 设计 方法 作 一 简单 介绍 。 


7.1.1 和 鲁 棒 分 析 的 多 项 式 代数 方法 


目 从 Routh 和 Hurwitz 建立 了 著名 的 稳定 判 据 以 来 ,人 们 称 对 应 连续 系统 的 稳定 多 
项 式 为 Hurwitz 多 项 式 , 并 以 瑟 表示 这 种 多 项 式 的 全 体 。 近代 最 有 意义 的 进展 由 俄罗斯 
学 者 XapuTono% 于 1977 年 得 到 的 结果 。 哈 氏 证 明了 一 个 具有 区 间 系 数 的 多 项 式 艇 为 互 
稳定 的 充 要 条 件 为 4 个 特定 的 多 项 式 为 已 稳定 的 。 其 重要 意义 在 于 :对 一 个 参数 在 大 范 
围 内 变化 的 系统 ,不 再 需要 检验 每 个 点 上 系统 是 否 稳定 ,而 仅 需 要 检查 4 个 特定 点 上 的 稳 ， 
定性 即 可 。 从 而 为 不 确定 系统 的 分 析 与 设计 提供 了 方便 的 工具 。 由 于 哈 氏 定理 仅 适 用 于 
区 则 多 项 式 艇 的 Hurwitz 问题 ,一 个 很 自然 的 想法 是 ,能 否 把 哈 氏 的 结论 推广 到 判断 离散 
系统 多 项 式 的 稳定 性 , 即 Schur 稳定 上 来 。 许 多 研究 者 从 事 了 这 一 方面 研究 ,但 问题 还 没 
有 人 完全 解决 。 对 于 一 般 的 DD 稳定 性 ,困难 就 更 大 。 这 方面 最 好 的 结果 是 Bartett 的 梭 边 定 
理 , 证 明了 只 要 验证 参数 区 域 的 一 维权 边 , 即 可 判别 整个 多 项 式 艇 是 否 万 稳定 。 


7.1.2 状态 空间 模型 的 重 棒 性 分 析 


态 空 间 模 型 的 稳定 鲁 棒 性 分 析 , 系 指 讨论 怎 阵 人 能 的 稳定 鲁 棒 性 .由 于 和 矩阵 空间 与 多 
项 式 空间 有 着 本 质 的 不 同 , 故 多 项 式 代 数 方法 中 的 一 些 结果 很 难 推广 到 和 矩阵 空间 。 例 如 ， 
险 氏 定理 \ 梭 边 定理 就 无 法 推广 到 矩阵 的 情形 。 对 于 和 矩阵 秘 瑟 稳定 的 鲁 棒 性 分 析 , 可 以 从 
特征 值 摄 动 的 角度 进行 讨论 。 到 目前 为 止 的 和 名 ,其 和 守重 
性 分 析 的 最 有 效 工具 是 Lyapunov 理论 ,其 主要 特点 是 能 处 理 时 变 不 确定 性 系统 。 应 
Lyapunov 方法 讨论 矩阵 的 矿 稳 定 摄 动 界 , 主 要 依据 由 矩阵 4 确定 的 矩阵 Baaas 
方程 

PA+A‘'P=—0 

或 利用 其 他 形式 的 Lyapunov 函数 。 由 于 这 种 方法 常 依赖 于 具体 形式 的 Lyapunov 函数 ， 
因而 所 得 到 的 结果 较为 局 限 或 偏 于 保守 。 

应 用 Lyapunov 方法 可 以 直接 设计 控制 器 ， 以 镇 定 具有 不 确定 参数 的 系统 ， 此 时 的 不 
确定 性 可 视 为 时 变 的 ,乃至 非 线性 的 。 对 于 这 类 问题 ,从 系统 不 确定 因素 产生 的 机 理 与 结 
构 上 给 出 的 某 些 约束 条 件 ( 即 “匹配 条 件 ”) ,进行 研究 ,有 益 于 问题 研究 的 深化 和 人 解决， 
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7.1.3 和 鲁 棒 性 分 析 和 设计 的 频 域 方法 


稳定 鲁 棒 性 分 析 ,是 鲁 棒 控制 的 最 基本 部 分 .为 了 设计 能 镇 定 具 有 给 定 范围 的 不 确定 
性 系统 的 控制 器 ,或 能 使 闭环 系统 具有 最 大 稳定 裕 度 的 控制 占 , 频 域 方法 取得 了 不 少 
成 果 。 

20 世纪 70 年 代 末 和 80 年 代 初 ,反馈 控制 设计 问题 经 历 了 一 个 深刻 的 再 认识 过 程 。 
在 基于 微分 方程 的 状态 空间 方法 占 优势 多 年 之 后 ,以 输入 -输出 频 域 分 析 为 基础 的 设计 方 
法 又 重新 得 到 了 应 有 的 重视 。 这 一 时 期 出 现 了 一 些 频 域 鲁 棒 分 析 的 重要 成 果 。Youla 等 人 
引入 了 互 质 矩阵 分 式 的 描述 方法 ,Rosenbrock 等 人 将 经 典 的 Nyquist 稳定 性 判 据 推 广 到 
多 输入 -多 输出 系统 ,Safonov 把 经 典 频 域 设 计 技 术 和 现代 多 变量 控制 方法 联系 起 来 , 建 
了 了 分 析 系 统 稳定 性 和 重 棒 性 的 一 种 新 的 概念 体系 避 。 

1981 年 ,Doyle 和 Stein 以 矩阵 奇异 值 为 工具 ,平行 地 推广 了 单 输入 - 单 输出 系统 Bode 
图 设计 方法 ,指出 影响 系统 鲁 棒 性 的 因素 是 系统 回 差 矩 阵 或 道 回 差 矩 阵 的 奇异 值 。 但 是 ,对 于 
结构 人 性 的 对 象 扰 动 ,基于 奇异 值 的 稳定 性 和 品质 测度 通常 是 很 保守 的 。1982 年 ,Doyle 引 人 了 
结构 奇异 值 的 概念 , 以 减少 这 种 方法 的 保守 性 , 逐渐 形成 了 所 谓 的 py 理论 。 

骨 棒 频 域 设计 法 中 最 近 发 展 起 来 的 另 一 个 有 力 的 工具 是 豆 ” 理 论 ,由 Zames 首先 提 
出 。 他 认为 :基于 状态 空间 模型 的 LQG 设计 方法 之 所 以 鲁 棒 性 不 好 ,主要 是 由 于 LQG 问 
题 所 使 用 的 积分 指标 造成 的 ;此 外 ,用 和 白 噪 声 模型 表示 不 确定 扰动 也 是 不 现实 的 .因此 ,在 
假设 扰动 属于 某 一 已 知 信号 集 的 情况 下 ,Zames 提出 用 其 相应 的 灵敏 度 函 数 的 如 = 范 数 
作为 指标 ,设计 目标 是 在 可 能 发 生 的 最 坏 扰 动 下 ,使 系统 的 误差 在 态 ~ 范 数 意 义 下 达到 极 
小 ,从 而 将 扰动 问题 化 为 求解 闭环 系统 稳定 ,并 使 相应 的 玉 ~ 范 数 指 标 极 小 化 的 输出 反馈 
控制 器 问题 。 

HH” 控 制 理论 已 经 被 尝试 用 于 交流 调 速 系统 .倒立 摆 、 柔 性 辟 , 以 及 空间 飞行 器 的 姿 
态 控 制 中 。 太 ~“ 设计 方法 把 复杂 的 数学 理论 和 工程 实际 相 结合 ,设计 者 可 以 在 很 大 程度 上 
控制 由 系统 产生 的 频率 响应 的 形状 ,但 计算 步骤 相当 繁琐 。 目前 ,~ 指标 能 够 在 多 大 程 
度 上 上 反 有 喘 工程 品质 , 尚 不 完全 清楚 。 


7.1.4 性 能 鲁 棒 性 设计 的 极 小 极 大 法 


为 了 使 鲁 棒 控制 真正 走向 实际 应 用 。 除 要 求 系统 具有 稳定 鲁 棒 性 外 ,还 必须 保证 系统 
具有 性 能 鲁 棒 性 。 因 为 稳定 鲁 棒 性 常常 限制 了 系统 的 闭环 带宽 ,从 而 降低 了 动态 跟踪 性 
能 。 对 于 给 定 的 不 确定 系统 ,如 何 设计 重 棒 控 制 器 使 得 系统 具有 性 能 鲁 棒 性 ,是 一 个 对 控 
制 工程 师 极 富 挑战 性 的 课题 。 对 于 实际 系统 , 仅 满足 稳定 性 要 求 是 不 够 的 ,还 必须 满足 工 
艺 和 过 程 的 许多 要 求 。 如 果 说 稳定 鲁 棒 性 是 定性 问题 , 则 性 能 鲁 棒 性 是 定量 问题 ,其 研究 
难度 也 就 大 得 多 了 。 : 

自 20 世纪 60 年 代 以 来 ,许多 学 者 研究 如 何 利用 对 策 论 的 思想 进行 系统 的 鲁 棒 性 设 
计 , 逐 渐 形成 一 套 设计 方法 , 称 为 极 小 极 大 (minmax) 设 计 方 法 。 其 基本 思想 是 把 人 们 所 设 
计 的 部 分 ,如 系统 辨识 器 滤波 器 及 控制 器 ,看 成 对 策 的 一 方 ,而 系统 不 确定 因素 则 看 成 对 
策 的 另 一 方 ,对 策 双方 对 性 能 指标 的 影响 是 互相 矛盾 的 ,设计 目的 是 尽量 减少 扰动 对 系统 
性 能 的 最 坏 影响 , 即 优化 扰动 下 的 最 坏 性 能 。 
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关于 利用 对 策 论 进行 参数 不 确定 的 鲁 棒 控 制 器 设计 ,一 些 学 者 将 其 看 成 微分 对 策 问 
题 。 由 于 需要 求解 微分 对 策 理论 中 的 极 小 极 大 问题 , 故 设 计 、. 计 算 过 程 复 末 。 最 近 对 有 限 
工作 点 对 象 给 出 了 一 种 极 小 极 大 LQ 控制 器 设计 方法 ,并 用 于 造纸 厂 捣 浆 机 的 控制 。 


7.2 和 鲁 棒 控制 的 基本 概念 与 数学 基础 


在 鲁 棱 控制 设计 中 , 常 采 用 如 下 定义 、 记 号 及 数学 概念 。 
7.2.1 和 鲁 棒 性 


鲁 棒 性 是 系统 在 一 定 ( 结 构 、 大 小 ) 的 参数 摄 动 下 ,维持 某 些 性 能 的 特性 。 

定义 中 强调 参数 摄 动 的 结构 和 大 小 ,是 因为 在 鲁 棒 性 分 析 和 设计 中 ,必须 考虑 参数 的 
摄 动 ,参数 的 摄 动 表征 了 系统 的 不 确定 性 。 系 统 要 维持 的 某 些 特性 可 以 是 稳定 性 ,也 可 以 
是 某 些 性 能 指标 。 

如 果 我 们 讨论 的 鲁 棒 性 ,是 系统 在 一 定 的 参数 摄 动 范围 内 维持 稳定 性 的 特性 , 则 称 为 
稳定 鲁 棒 性 ;如 果 我 们 讨论 的 特性 是 某 些 性 能 指标 , 则 称 为 性 能 鲁 棒 性 .显然 ,一 个 系统 是 
性 能 鲁 棒 的 ,也 必须 同时 是 稳定 鲁 棒 的 。 


7.2.2 备 棒 度 


系统 在 维持 某 些 特性 的 条 件 下 ,所 允许 的 某 类 参数 摄 动 的 最 大 度量 , 称 为 鲁 棒 度 ,又 
称 鲁 棒 测 度 ，。 

鲁 棒 度 对 鲁 棒 性 的 程度 进行 了 定量 描述 。 系 统 的 鲁 棒 度 依赖 于 系统 要 维持 的 特性 和 
参数 摄 动 的 结构 。 对 参数 摄 动 结构 了 解 得 越 多 , 且 对 系统 的 要 求 越 低 ( 如 仅 要 求 稳定 性 )， 
则 得 到 的 鲁 棒 度 必然 越 大 。 


7.2.3 也 -稳定 性 


对 于 线性 定常 系统 == Ax, 车 矩阵 4 的 特征 值 集合 4(4)CD, 其 中 D 是 复 平面 上 任 

意 指 定 区 域 , 则 称 该 系统 是 稳定 的 ,或 具有 DD 稳定 性 。 
指定 的 DD 域 不 同 ,系统 的 稳定 程度 也 不 
人 同 。 当 DD 域 取 为 图 7-1 所 示 区 域 (0,a) , 且 主 导 


Mh 极点 条 件 成 立时 ,系统 即 可 保证 工程 中 经 常 要 
V7 | 求 的 调节 时 间 、 阻 尼 比 等 响应 指标 ; 当 万 域 取 
ll 0 ” “为 左 半 * 平面 时 ,D 稳定 即 通常 意义 下 的 已 稳 
定 。 若 把 适当 选取 的 D 稳定 性 作为 系统 要 维护 
的 特性 , 则 和 鲁 棒 性 就 有 更 简明 的 含义 ,更 便于 重 

棒 性 的 分 析 和 设计 。 


在 系统 的 鲁 棱 性 分 析 与 设计 中 ,经 常 采用 


图 7-1 妃 稳 定 域 抽象 代数 .矩阵 范 数 、 奇 异 值 .Hardy 空间 等 数 


学 概念 。 为 便于 查阅 ,简要 叙述 如 下 。 
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7.2.4 抽象 代数 


群 、 环 . 域 是 三 个 基本 的 代数 系统 。 在 多 变量 系统 研究 中 , 环 的 概念 尤为 重要 。 

一 个 实数 集 R, 对 于 任意 的 a,b 和 < 属于 R, 有 加 法 和 羔 法 二 元 运算 ( 记 为 十 和 ，) 
且 具 有 以 下 性 质 , 则 称 及 为 一 个 环 。 

QOD (a+6b)ER (加 法 封闭 )。 

@ a 二 b= 二 b 十 a (加 法 可 交换 )。 

@@ a 十 (十 c) = 一 (Ca 十 六 十 c (如 法 满足 结合 律 )。 

@) 存在 一 个 零 元 素 , 记 为 “0”, 有 

a 十 0 二 0 十 a (加 法 同一 性 ) 

@ 存在 一 个 与 a 有 关 的 元 素 记 为 一 az, 有 

a 十 (一 a) 二 0 (加 法 道 运 算 ) 
(@)a*bER (乘法 封闭 )。 
(Da，(b，c)= 二 (a+65)。c (乘法 满足 结合 律 )。 
a* (p 二 c) 一 ap 十 ac , 

CD (乘法 对 加 法 的 分 配 律 ) 。 

本 普 通 代 数 相 比 ,一 般 环 乘法 不 可 交换 ,没有 乘法 的 同一 性 ,不 是 每 个 元 素 都 有 乘法 
的 逆 运 算 。 如 果 一 个 环 RR 具有 乘 的 单位 元 ,用 1? 表示, 并 且 如 果 有 一 个 属于 R 的 元 素 a 
有 飞 法 的 道 运算 , 即 存 在 一 个 元 素 a !, 有 

a*a '=a !:。*a=1 
则 称 a 为 一 个 单元 。 

普通 代数 中 的 一 个 域 是 一 个 环 ,其 中 乘法 有 交换 性 ,存在 乘法 的 同一 性 , 且 每 个 非 零 
元 素 都 是 一 个 单元 。 

在 多 变量 系统 理论 中 出 现 的 一 些 重 要 环 包括 :矩阵 加 法 和 乘法 下 的 矩阵 平方 环 :在 多 
项 式 加 法 和 乘法 下 的 * 多 项 式 环 ;在 s 右 半 闭 平面 无 极点 的 s 的 真有 理 函 数 环 (稳定 的 传 
递 师 数 )。 

需要 指出 :矩阵 乘法 不 存在 交换 律 , 多 项 式 的 倒数 不 再 是 多 项 式 , 稳 定 传递 函数 的 倒 
数 不 一 定 稳 定 。 因 此 ,用 代数 方法 研究 和 矩阵、 多 项 式 和 稳定 的 传递 函数 时 ,要 使 其 满足 环 的 
一 般 结 构 形 式 。 


“7.2.5 互 质 矩 阵 


在 多 变量 系统 中 ,党 采用 互 质 矩阵 的 概念 ,特别 是 左 , 右 互 质 矩 阵 分 式 的 概念 。 有 理 传 

递 晒 数 算 阵 G(s) 表 示 成 矩阵 公式 的 形式 为 

G(s)=N,D,'= DN, (7-1) 
式 中 N,Ni.D, 和 万 均 为 多 项 式 和 矩阵。 其 中 ,N. 和 D,(detD, 关 0) 是 右 互 质 矩 阵 ;N, 和 也 
(detD, 关 0) 是 左 互 质 和 矩阵 。 

互 质 矩阵 的 定义 为 : 记 M(R) 为 矩阵 集 , 其 元 素 在 环 R 内 。 假 设 环 R 是 可 交换 的 ,并 
共有 乘法 的 同一 性 ,两 个 矩阵 4 和 B 有 相同 的 列 , 且 都 属于 M(R)。 如 果 4 和 B 的 每 个 最 
大 的 右 公约 数 是 单位 模 的 , 则 称 4 和 B 是 右 互 质 矩 阵 ; 如 果 4 和 B 有 相间 的 行 , 且 都 属于 
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M(R), 其 每 个 最 大 的 左 公 约 数 是 单位 模 的 , 则 称 4 和 8 是 左 互 质 和 矩阵 。 

定义 中 的 单位 模 和 最 大 公约 数 的 基本 概念 是 ;如 果 属 于 MCR) 的 一 个 方 阵 ,其 行列 式 
在 中 为 1, 则 此 方 阵 称 为 单位 模 ;如 果 4 二 ED,B 二 FD, 即 D 为 4、B 的 右 公 约 数 , 厂 DD 
为 4.B 的 男 一 任意 右 公约 数 , 和 且 D==GD' , 则 属于 M(R) 的 方 阵 DD 称 为 4 和 B 的 最 大 右 
公约 数 ; 同 理 , 类 似 地 可 定义 最 大 左 公约 数 。 

两 个 属于 M(R) 的 矩阵 4、B 是 右 互 质 矩 阵 的 充分 必要 条 件 是 :存在 矩阵 对、Y 属于 
M(R) ,满足 下 列 矩 阵 Diophantine 方程 

XA 十 YB=J : (7-2) 

式 中 了 为 MCR) 中 的 单位 矩阵 Diophantime 方程 在 多 变量 系统 的 鲁 棱 设计 中 起 着 重要 的 
作用 。 


7.2.6 和 矩阵 范 数 和 奇异 值 


(1) 和 矩阵 的 奇异 值 
设 术 (4) 为 n 阶 复 方 阵 4 的 第 i 个 特征 值 ,o;(4) 为 n 阶 复方 阵 4 的 第 ; 个 奇异 值 ,定义 
oai(4) 一 人 (Ch4HA) 3 (7-3) 
式 中 4 记 为 矩阵 4 的 共 斩 转 置 和 矩阵 。 
任 一 矩阵 4 均 可 进行 奇异 值 分 解 , 即 
A=UEV! (7-4) 


式 中 UrU=1,V"V=1,3=diag{o1,0:,*… 0,)。 
奇异 值 是 非 负 实数 , 常 记 o 为 最 大 奇异 值 ,o 为 最 小 奇异 值 。 易 证 
0(4) 一 外 4| (7-5) 
在 鲁 棒 性 分 析 中 ,常常 需要 确定 使 矩阵 7 十 AH 非 奇 异 时 M 阵 的 条 件 。 其 中 了 为 单位 
阵 ,4 是 体现 不 确定 因素 的 和 矩阵。 若 4 阵 是 非 结 构 性 的 , 且 oC4) 志 1, 则 使 1 十 AM 非 奇 异 
时 ,M 阵 的 充分 必要 条 件 为 
cM)<]1 (7-6) 
上 述 条 件 往往 偏 于 保守 ,同时 A 有 时 是 结构 性 的 ,为 此 引入 结构 奇异 值 的 概念 , 记 作 
KC(M)。 定 义 
uC(M)=[min{a(A) |det (1+ AM) =0}]- (7-7) 
其 中 极 小 化 是 针对 给 定 结构 的 一 组 A, 且 c(A) 王 1。 
可 以 证 明 : 如 果 A 是 非 结 构 的 , 则 jCM)=aoCM); 且 如 果 A=61, 则 y(M)=oCM)。 这 
里 p(M) 是 矩阵 M 的 谱 半 径 , 有 
PM)—max {A(M)! (7-8) 
(2) 矩阵 的 范 数 
对 于 传递 矩阵 G(s) ,假设 其 各 项 在 * 右 半 开 平面 是 复 变量 ;的 解析 函数 , 且 是 ;的 有 
理 实 函 数 , 则 常用 的 G(s) 的 范 数 有 如 下 几 种 。 
号 ; 范 数 。G(s) 的 已; 范 数 记 为 ‖ G(s) ,, 定 义 为 


co 1 
Lew l=[| rerdwGdwdol (7-9) 
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式 中 tr4 为 矩阵 4 的 迹 。 
@@ 五 " 范 数 。GC(G) 的 五 " 范 数 记 为 外 GCC) ,定义 为 
1cG) | =supolG Cw)] (7-10) 
式 中 ow 为 实数 。 
@ Hankel 范 数 。 对 于 传递 逢 阵 GCs) 二 CCs1 一 4)-1B8 十 D, 设 ReAh(4) 二 0,1= 二 1,2,*…， 
2”， 即 系统 是 渐 近 稳定 的 ,上 且 假 征 系 统 可 榨 、 可 观 , 和 矩阵 P.O 是 下 列 Lyapunov 方程 的 正定 
解 
AP-+PA' =——BB 
z A'Q+FOA=—CC 
则 G(s) 的 Hankel 范 数 记 为 上 G(s) js, 定义 为 


| GCs) | n= [A CPO) J (7-11) 
而 Hankel 奇异 值 记 为 cx[G(s)] ,定义 为 
oiLG C8) J= [APO) J? (7-12) 


7.2.7 Hardy 空间 


Hardy 空间 的 概念 几乎 很 少 出 现在 1975 年 以 前 的 控制 文献 中 。Hardy 空间 基本 上 对 
应 于 有 界 输 人 有 界 输出 的 稳定 系统 传递 矩阵 的 空间 。 

如 采 传 递 和 矩阵 G(s) 在 s 右 半 开 平面 上 解析 , 且 FH? 范 数 有 界 , 则 算 阵 G(s) 属 于 和 矩阵 
Hardy 空间 在; 如 采 答 阵 G(s) 在 s 右 半 开 平面 上 解析 ,和 且 石 * 范 数 有 界 , 则 和 矩阵 G(s) 属 于 
和 矩阵 Hardy 空间 已 ” 。 

以 上 我 们 所 说 的 * 右 半 开 平面 是 指 Res 盖 0, 且 针对 连续 时 间 系 统 而 言 . 对 于 离散 时 间 
系统 ,采用 = 变换 传递 函数 (脉冲 传递 函数 ) ,其 解析 域 为 > 平面 上 单位 圆 内 。 


7.3 五 "最 优 控制 理论 


业已 证 明 , 线 性 二 次 型 高 斯 (LQG ) 控 制 系统 的 幅 值 裕 度 为 0.5~coe ,相位 裕 育 大 于 等 
于 60 。 然 而 ,LQG 控制 系统 对 被 控 对 象 的 模型 援 动 (误差 ) 的 鲁 棒 性 有 时 却 很 差 。 人 们 在 
实际 工程 中 常会 遇 到 如 下 情况 : 

(D 被 控 对 象 的 精确 模型 难以 得 到 ,或 即使 可 以 得 到 但 过 于 复杂 ,为 了 便于 分 析 和 设 
计 , 必 须 简 化 ,从 而 导致 建 模 误差 。 

@) 随 着 系统 的 工作 条 件 ( 环 境 ) 的 变化 ,以 及 系统 中 元 器 件 的 老化 或 损坏 ,被 控 对 象 
的 特性 也 随 之 而 变 , 从 而 偏离 设计 时 采用 的 标 称 特性 。 

3 噪声 /扰动 的 (统计 ) 特 性 是 不 确定 的 ,或 者 是 未 知 的 。 

鉴于 这 些 实 际 情况 ,人 们 对 LQG 等 控制 方法 进行 反思 。 提出 了 许多 和 鲁 棒 控制 系统 设 
计 方 法 ,而 如” 最 优 控 制 理论 正 是 其 中 的 佼佼 者 。 : 

以 控制 系统 内 某 些 信和 号 间 的 传递 矩阵 的 驴 ~ 范 数 为 优化 设计 指标 ,这 一 思想 是 G. 
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Zames 于 1981 年 首先 提出 的 ,此 后 有 众多 的 学 者 投身 于 五 "优化 设计 理论 的 研究 ,使 之 
不 断 发 展 ,形成 了 较为 完整 的 理论 体系 。H” 最 优 控制 , 简 育 之 ,就 是 利用 右 ~ 范 数 作为 目 
标 尔 数 的 度量 ,来 进行 系统 优化 设计 。 态 ”" 范 数 是 定义 在 Hardy 空间 右 ,(p= 二 %) 上 的 范 
数 ; 在 矿 ” 控 制 理论 中 ,是 指 在 s 右 半 平 面 上 解析 的 有 理 旺 数 阵 的 最 大 厅 寞 值 ;在 标量 晴 
数 情况 下 ,是 指 幅 频 特 性 的 极 大 值 。 因 此 ,如 果 使 系统 扰动 至 误差 的 传递 函数 的 鼠 ” 范 数 
最 小 , 则 具有 有 限 功 率 谱 的 扰动 对 系统 误差 的 影响 可 降 到 最 低 限 度 。 这 就 是 五 "最 优 控制 
的 基本 思想 。 这 一 优化 设计 理论 具有 以 下 特点 : 

0 能 有 效 地 人 处理 被 探 对象 有 模型 摄 动 ( 误 差 ) 时 的 鲁 棱 设计 问题 。 

四 不 要 求 噪 声 / 扰 动 为 一 给 定 ( 统 计 特性 ) 的 信号 。 它 可 以 是 属于 如 下 集合 的 任意 
信和 号 

(7 y=Gx,| x (1) dt<oo | 


式 中 G( 和 G- ') 是 稳定 的 有 理 函 数 。 即 假设 噪声 /扰动 为 任意 能 量 有 限 的 信和 号， 

@ 多 种 控制 问题 均 可 变换 成 五 "控制 的 标准 问题 来 处 理 , 所 以 该 理论 具有 一 般 性 ， 

@ 能 对 稳定 鲁 棒 性 和 性 能 鲁 棒 性 进行 综合 设计 。 

H” 控 制 理论 自 提出 至 今 ,经 历 了 一 个 曲折 的 发 展 过 程 ,产生 了 许多 设计 方法 。 概 括 
而 言 , 妃 " 优 化 设计 理论 可 分 为 频 域 方法 和 时 域 方法 两 类 。' 频 域 瑟 " 法 是 把 一 个 传递 函数 
阵 的 右 ” 范 数 最 小 化 问题 ,通过 镇 定 控制 器 的 Youla 参数 化 ,变换 为 模型 匹配 或 一 般 距离 
问题 ;然后 再 变换 为 Nehari 问题 进行 求解 。 尽 管 频 域 方法 在 ”控制 理论 发 展 的 前 期 起 
过 主导 作用 ,并 在 多 种 情况 下 给 出 了 问题 的 一 般 解 ,但 却 存在 明显 的 不 足 。 如 ;数学 工具 复 
杂 ,控制 器 可 能 不 稳 , 其 阶 次 可 能 过 高 ,以 及 计算 量 大 。 后 来 的 研究 表明 ,时 域 方法 能 更 直 
接地 给 出 妃 ” 控 制 问题 的 解 。 时 域 五 "法 不 采用 输入 输出 传递 函数 阵 描 述 ,而 直接 在 状态 
宝 间 描述 上 进行 设计 (虽然 五 "优化 设计 指标 本 身 是 基于 输入 输出 描述 的 ) .时 域 瑟 * 设 计 
方法 不 仅 过 程 简 单 ,计算 量 小 ,而 且 所 得 到 的 控制 器 阶 次 低 ( 小 于 或 等 于 被 控 对 象 的 阶 
次 ) ,结构 特性 明显 。 

目前 , 吾 " 最 优 控 制 的 基本 思想 正 逐 步 渗 透 到 控制 理论 的 一 些 分 支 ,形成 了 昌 ” 自 适 
应 控制 理论 ,五 ” 系 统 辨 识 理论 以 及 非 线 性 态 ” 控 制 理论 等 ， 


7.3.2 H” 探 制 理论 所 涉及 的 几 种 函数 空间 


(1) 时 域 函数 空间 
@D 12( 一 oo,c0) :由 所 有 平方 可 积 的 函数 x(1) :RC" 所 组 成 的 函数 空间 。 即 一 oo<1 过 oo， 
x(DEC',| x(n) 上 ?dt<oo。 其中, |。 中 为 欧 几 里 得 范 数 。 


在 1 (一 ceyeceo) 上 定义 内 积 如 下 :对 于 x(t) y(t) EL (—o00,00) , 有 
(ep) = x yd 


式 中 x 表示 xz 的 共 轿 转 置 。 这 使 上 (一 口 ,oo0) 成 为 一 个 Hilbert 空间 。 注 意 , 这 里 定义 的 
内 积 , 对 第 一 变 元 为 共 轿 线性 ,而 对 第 二 变 元 为 线性 。 但 这 不 会 引起 什么 问题 。 因 为 可 以 
令 (x,y) 二 (y,X) ,这 样 便 与 通常 的 意义 相符 了 。 
对 应 的 导出 范 数 定义 为 “ 
.232 。 
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| xC) 1 一 [xy 一 i x rl) dt | 


这 样 ,函数 空间 (一 oo ,co) 按 此 范 数 成 为 一 Banach 空间 。 应 当 指 出 ,上 述 积分 是 一 般 的 
Lebesgue 积分 。 
@ 产 [0,co): 由 所 有 对 :<0 除 在 测度 为 零 的 集合 上 ( 即 几 乎 所 有 :< 0) 均 为 零 的 
产 ( 一 coycoe) 内 的 函数 全 体 所 构成 的 集合 。 
ZL0,eco) 是 三 (一 coco) 的 一 个 财 子 空间 ,其 正 交 补 记 为 Z 到 (一 cp,0j。 因 此 
Z2( 一 coyco) 一 瑚 (一 co 0] 四 大 Fo,co) 


他) L:(R,C”™*") .所 有 RR 一 C"*" 目 满足 下 式 的 本 数 知 阵 六 Cz) 的 集合 : | trace (XX¥)di<oo, 
其 中 ,trace 表示 矩阵 的 迹 , 积 分 也 指 Lebesgue 积分 。L(R,C”") 是 (一 co,co) 推 广 到 
和 矩阵 的 情形 ， 

在 Li(R,C””) 上 定义 内 积 以 及 导出 范 数 为 

GCC 一 | trace (XY)d 


| XG) = ,G1 
这 样 ,L(R,C”*") 按 此 内 积 ( 范 数 ) 成 为 Hilbert 空间 (Banach 空间 ) 。 
(2) 频 域 明 数 空间 
(D 天 :在 所 有 频率 上 有 定义 , 取 值 于 C" 内 的 且 对 w(Lebesgue) 平 方 可 积 复 函 数 x(jw) 


的 全体 所 构成 的 空间 , 即 满足 x jw): 退 一 C" ,| za(jo)z(jo)do<co 的 函数 x(jw) 的 集 


人 
Hs 


在 1? 上 定义 的 内 积 和 导出 范 数 为 
x9)= 直 | x Go)y Cw) do, Vx,yEL’ 


| x) ,=L x,x > 
这 样 ,Z 按 如 上 内 积 ( 范 数 ) 成 为 Hilbert(Banach) 空 间 。 
@ RE :其 定义 为 
RL 二 {x|xE zx 为 实 有 理 函 数 向 量 } 
RL 是 1 的 一 个 向 密 子 空间 。 故 RL? 不 会 按 上 面 定 义 的 内 积 ( 或 范 数 ) 成 为 Hilbert (或 
Banach ) 空 间 。 
(83) HH ;在 开 右 半 平 面 Res 盖 0 上 解析 ,在 C" 上 取 值 ， 旦 满足 如 下 一 致 平方 可 积 函 数 
x(s) 的 全 体 所 构成 的 空间 


: sup 去 | | xs 十 jwy) | do] < 
若 将 上 式 左 侧 的 值 定义 为 xGs) 的 范 数 | xcG) |， 则 殖 : 按 此 范 数 成 为 Banach 空间 。 
设 xzE H?, 则 对 几乎 所 有 的 w, 极 限 xCjw) 二 limx($ 十 jw) 存 在 , 且 ZE ZL*, 而 且 映 射 
x 一 x 是 H: 一 L? 的 线性 单 射 的 保 范 映射 。 这 里 说 函数 f(x) 为 单 射 的 ,是 指 当 x 关 xs 时 ， 
f(x1) 关 f(xz:)。 而 说 映射 x 一 x 为 保 范 的 ,是 指 上 x ,= x，,。 
虽然 在 五" 中 的 函数 x 在 虚 轴 上 事先 没有 定义 ,但 我 们 将 它 和 它 在 L? 中 的 边界 函数 
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x 等 同 起 来 ,而 略 去 符号 “` ”, 从 而 把 恕 : 视 为 L? 的 一 个 闭 子 空间 。 

@ (9 1!;: 是 HH? 在 ZL 内 的 正 交 补 空间 ,其 定义 可 在 上 述 已 : 的 定义 中 ,将 >0 改 为 
< 一 0 即 可 。 

(© RH?:RH? 二 {xlxE Hi’,x 为 实 有 理 孙 数 向 量 )。 

G) (RH)-+ ;RH: 在 RL? 中 的 正 交 补 。 

易 见 ,RH? 为 Res 宇 0 内 无 极点 的 严格 真实 有 理 函 数 向 量 全 体 所 构成 的 空间 。 显 然 ， 
如 下 关系 成 立 : 

L?=HODH)+ 
RL:=RH’:O (RH’)+ 
例 7-1 若 f(s)= 二 2/Cs 十 1) Gs 一 1), 则 f(s)ERL?:。 作 分 解 


] 1 
f(s) 一 一 村 1 一 8 (5s) 十 goCs) 


式 中 gC(5) 二 1/(s 一 1)E€ (RH)+ ,gs5)=—1/(s+1)ERH’. 

(3) 频 域 函数 矩阵 空间 

(DL :由 jR>C”™*",H ess supoLF(jw)j]<< 吕 的 函数 矩阵 FCjw) 的 全 体 所 构成 的 空 
间 。 该 空间 按 范 数 

| FO(jw) || =ess supoL F (jw) J” 
成 为 Banach 空间 。 这 里 ,oF[ (jw) | 表示 FGw) 的 最 大 奇异 值 ，。 
oF (jw) J=max[% CF OW)F OGw) Dh 

RL”: 由 LL” 中 实 有 理 函 数 和 矩阵 的 全 体 构成 。 易 知 ,RL” 是 在 虚 轴 上 无 极点 的 真有 
理 晴 数 和 矩阵 的 全 体 。 | z 

BH”™; 由 jR 一 C”* 的 , 且 满 足 sup {of[F(s)] Res 之 0} 二 oo 的 函数 矩阵 Cs) 的 全 体 构 
成 的 空间 。 定 义 F(s) 的 范 数 

EC) | ,=sup{of Fs) ||Res>0)} 

同样 ,我们 可 以 将 太 * 中 的 函数 矩阵 的 定义 域 拓 延 到 虚 轴 上 ,这 样 ,~ 成 为 L” 的 -- 
个 闭 子 空间 。 

类 似 于 RH?、(H’)-、(RH?)+ 的 情形 ,我 们 也 可 以 定义 RH™”,(H™”)+, (RH”)+ 空 间 ， 
且 有 如 下 关系 ， 
有 一石 "由 (万 ”)- 

REL” 三 RH 中 CRH2 )- 

胃 知 ,RH” 是 由 在 Res 之 0 内 无 极点 的 真有 理 函 数 和 矩阵 全 体 构 成 的 空间 。 

例 7-2 若 


《5 一 2)(05 十 2) 
f(D) Tt) 


试 证 :f(s)ERL”, 但 f(s)ERL’，。 
证 明 对 f(s) 作 分 解 , 可 得 
f(s) = (s) 二 gs(s) 
式 中 
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g1(s) = 人 ERH= 


ga(s) = €E (RH™)+ 
可 以 证 明 , 如 下 结论 成 立 。 
人 若 下 EL , 则 丰产 伺 产 , 且 
| 五 上 外 = 一 supL | Fx|s|lxEL, lx) :=1j=sup[l | Fx | lxEH’, xl :一 T] 


_ | Fx | > nD 
=sup| [xl, Ix€EH’, | x| :天 0 | 


式 中 上 。 | ;为 L 或 ?上 的 范 数 。 
电厂 FEH™”, 则 FH*CH'*, 且 


1F1 =supL Fx lolrEH’, xls=1]=sup| 2 lzE H’, | x ls#0) 
式 中 是 。 由 :为 H* 上 的 范 数 。 
注 记 ， 
QD 有 时 我 们 称 oo 范 数 为 2 范 数 的 导出 范 数 ， 
四 令 xEH? 的 拉 氏 反 变 换 为 x, 则 由 Planchere 定理 可 知 
| zl | dt 


故 外 zj 是 信号 x(9) 的 能 量 。 若 今 下 E 五 ”为 一 系统 的 传递 函数 阵 ,而 y= 一 Ex 为 系统 的 输 
出 , 则 


1F1 =sup[ 2 IxE H:, | xl,#0] 


| x， 
因此 , Fj。 可 视 为 该 系统 的 能 量 放 大 系数 。 
(4) 传递 函数 矩阵 运算 的 几 个 公式 

若 令 


4 
|=[4,B8,C,D]=CG1—A) -1B+D 


则 有 
[A,B,C,D]={[T AT,T B,CT,D)] 
[A,B,C,D] '=|A—BD 'C,BD ',—D- 'C,D-!| 
[A4,B,C,D]I~=[—A',—C,B',D’| 
[Ai,Bi,C1,D, |]X|A,,B,,C,,D,) 


A Bl, rBD, 
1 A, | B, ce DiC],DiD,| 


se, [ee cam 


[A "Bl ;C1 ,万 ,十 [4， ,BB; ,C2 , D, | 


-lo bbb ca 


| 


| 
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7.3.3 标准 H” 控 制 问题 
(1) 标准 五 "控制 问题 


各 种 及” 控制 问题 ,都 可 以 化 成 图 7-2 所 
示 的 标准 问题 ,图 中 ,w、z.u 和 yy 均 为 向 量 值 信 
号 :mw 是 / 维 外 部 输入 信号 ,一 般 包 括 指令 ( 参 
考 ) 信 号 ,扰动 和 传感器 噪声 ;z 是 p 维 被 控 输 
出 ,通常 包括 跟踪 误差 .调节 误差 及 执行 机 构 
输出 ;wu 是 维 控 制 信 号 ,同时 也 是 控制 器 输 

图 7-2 标准 H” 框 架 出 ;y 是 m 维 量 测 输出 ,可 能 是 传感器 输出 信 

号 及 指令 信号 等 。 

在 图 7-2 中 ,G 和 分 别 表 示 广 闵 被 控 装 置 和 控制 器 。 前 者 是 系统 的 给 定 部 分 ,后 者 
有 竺 设计 .应当 指 出 ,广义 被 控 装 置 并 不 完全 是 实际 的 被 控 装 置 ,对 于 同一 被 控 装 置 , 若 设 
计 目 标 不 同 ,其 广义 被 控 装 置 也 可 能 不 同 。 今 后 , 若 不 特别 说 明 ,总 假定 G 和 为 线性 时 
不 变 系统 的 频率 域 找 述 , 并 假定 传递 函数 矩阵 GCs) 和 Gs) 是 真有 理 的 。 

根据 w、z、u 和 yy 的 维 数 , 可 将 G 分 块 成 


o=[ | (7-13) 
Gl Cr 
则 图 7-2 实际 代表 如 下 代数 方程 : 

z=GiwtGi2u (7-14) 

y=Gw+ Gu (7-15) 

u= Ky (7-16) 
如 果 (1 一 GzzK) 为 可 逆 的 真有 理 和 矩阵 , 则 

z=|Gun t+GK(—G,KR) G, |w (7-17) 
而 从 w 到 zz 的 传递 消 数 矩阵 为 / 
T=F(G,K)=GL TGuR(T— GR) CO， (7-18) 


HH 控制 的 标准 框架 或 标准 问题 是 : 求 一 真有 理 的 KK, 使 G 稳定 ,并 使 传递 矩阵 (7-18) 
的 及” 范 数 极 小 。 即 


min{ | F,(G,K) .|K 使 G 稳定 ) (7-19) 
或 者 表述 为 ; 求 所 有 真有 理 玉 ,使 G 稳定 , 旦 使 
| FG,K) | <7Y, 7YER (7-20) 
下 面 讨 论 可 以 化 成 ”标准 问题 的 三 个 方面 。 


1) 跟踪 问题 。 

在 图 7-3 中 ,P(s) 为 已 知 被 控 装 置 , 其 输出 vr 要 跟踪 参考 输入 信号 7, 被 控 装置 的 控制 
输入 uw, 是 由 xr 和 v» 分别 通过 控制 器 Cl 和 C 所 产生 的 , 即 

六 
27 一 Cr 十 Cy 一 [LC， ca]| "| 
这 里 ,参考 输入 r 并 不 是 一 个 已 知 的 确定 信号 , 它 是 一 类 能 量 有 限 信号 中 的 -种 , 即 r 是 集合 
{rr 一 Ww,wEH’ ,|w|;, 夺 1}) 中 的 一 种 。 
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在 跟踪 问题 中 ,P 和 WW 已 知 ,而 人 
和 C, 有 得 设计 。 跟踪 误 差 (r 一 v) 目 然 是 
设计 控制 系统 所 关心 的 实际 被 控 量 。 如 
和 东单 纯 追 求 跟踪 误 善 最 小 ,可 取 外 一， 
lz 作为 目标 晃 数 。 若 要 兼顾 控制 信和 与 
的 幅度 ,可 在 目标 蚁 数 中 增加 一 个 加 权 图 7-3 女 踪 问题 
控制 能 量 项 , 便 可 保证 存在 最 优 的 真有 
理 控 制 问 。 因 此 ,在 跟踪 问题 中 取 上 r 一 ve‖ 十 上 pu 上 2 作 为 目标 函数 。 该 目标 函数 等 于 


信和 号 
于 -一 全 
| 
的 太 " 范 数 ,其 中 6>0 为 加 权 因 子 。 于 是 ,跟踪 问题 可 以 化 为 目标 函数 
sup( | zi ,.:wEH!’, | Ww | ;1) 


的 极 小 化 问题 。 
为 将 跟踪 问题 化 为 相应 的 标准 五" 控制 问题 ,到 


| 
~ -一 + J》 一 
ou y 


外 部 输入 信号 为 w, 控 制 输 人 信和 号 为 &。 这 时 ,广义 被 控 系 统 及 控制 器 方程 为 


r—ypy W ”一 
z ou 0 pi TY 
-= r Iw 0 " 人 
0 P 
& 一 [C， cj]| 
相应 的 G 和 为 
co,=| |， Gu=| |， c.=| |， Gu=| ,| (7-22) 
0 ol 0 P : 
下 一 [CC (7-23) 


这 样 ,图 7-3 跟踪 问题 便 转 换 成 图 7-4 所 示 的 标准 问题 。 

由 图 7-4 明显 可 见 , 标 准 问题 中 G 和 以 及 wzu、y 与 实际 被 控 系统 各 量 的 关系 ， 
其 中 & 和 y 是 为 实现 控制 所 需 的 实际 物理 装置 的 输入 和 输出 信号 , 称 为 系统 的 内 部 信号; 
而 w 和 z 是 设计 中 认为 重要 的 虚构 信和 号, 称 为 外 部 信和 号。 

2) 稳定 和 鲁 棒 性 问题 . 

稳定 得 棒 人 性 问题 如 图 7-5 所 示 。 由 于 参数 变化 和 未 建 模 动 态 的 存在 ,实际 被 控 装 置 的 
动态 特性 是 变化 的 .如 果 把 设计 时 所 依据 的 模型 叫 作 标 称 被 控 装 置 ,那么 特性 的 变化 就 叫 
.做 未 知 摄 动 ,或 称 摄 动 。 摄 动 可 以 是 如 图 7-5 所 示 的 相 加 型 摄 动 ,也 可 以 是 相 乘 型 摄 动 ,前 
者 摄 动 模 型 表示 为 严 十 AP, 后 者 为 PC 十 4 ) 或 (7 十 A)P。 稳定 性 的 鲁 棒 性 , 系 指控 制 器 天 
不 仅 使 标 称 被 控 装 置 P 稳定 ,而 且 也 使 摄 动 后 的 被 控 装置 P 十 AP 或 P(Z 十 A ) 稳 定 。 
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(0) 涩 换 结果 


7-5 稳定 鲁 棒 性 问题 
今 以 相 加 型 摄 动 为 例 , 说 明 如 何 将 稳定 鲁 棒 性 问题 转化 为 标准 互 ” 控 制 问题 ， 
假设 P 为 严格 真 标 称 被 控 装 置 , 令 RE RH” 是 一 个 标量 函数 。 如 果 摄 动 后 的 P+ AP 
是 严格 真有 理 和 矩阵 , 且 和 P 有 相同 数目 的 Res 实 0 极点 ,其 中 AP 满足 如 下 限制 ， 
| AP(jo) | ,< IROGw)|, OKw<oo (7-24) 
其 稳定 鲁 棱 性 的 提 法 是 : 求 真有 理 阵 尺 , 使 所 有 被 控 装 置 P 十 AP 稳定 。 事实 上 可 以 证 明 ， 
在 所 述 条 件 下 有 如 下 充分 必要 条 件 。 
引 理 7-1 一 个 真有 理 阵 六 能 稳定 所 有 P 十 AP 的 充分 必要 条 件 是 :KK 使 稳定 ,日 
满足 
| RK CU —PK)- | ,<1 (7-25). 
式 中 AP 满足 式 (7-24)。 
很 明显 , 石 将 广义 被 控 装置 G 定义 为 
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c=| ， | (7-26) 
1 P 


则 稳定 鲁 棱 性 问题 化 为 如 图 7-6 所 示 的 标准 问题 , 即 选择 处 使 G 稳定 , 且 使 从 ww 到 2z 的 
传递 阴 数 阵 
Fi(G,K)=RK(U—PK)”! 


的 仿 ” 范 数 满足 
| RK — PK)-! ,<1 (7-27) 


图 7-6 稳定 鲁 棒 性 问题 的 转化 图 7-7 模型 匹配 问题 


3) 模型 匹配 问题 。 

图 7-7 表示 用 串联 的 三 个 传递 函数 和 矩阵 了 T;、Q 和 TT, 去 通 近 传递 蛆 数 阵 TT ,这 种 问题 
称 为 模型 匹配 问题 。 在 该 问题 中 ,已 知 T.T,、T;ERH” ,而 OERH” 有 待 选 择 。 

模型 匹配 问题 的 提 法 是 :选择 OE RH”™ ,使 

sup{ | zs:wEH?, | wl <<1) 

极 小 , 即 上 工 , 一 T,QT， | -~- 极 小 。 

模型 匹配 问题 可 以 转化 为 标准 鼠 ” 问 题 , 取 

~ 
7， 0 
K=—0 

要 求 天 使 G 稳定 ,等 价 于 要 求 QE RH”™。 | 

研究 模型 匹配 问题 的 重要 意义 在 于 :标准 问题 可 以 转化 成 较 简 单 的 模型 匹配 问题 ,后 
者 有 较 好 的 解法 。 

(2) 互 质 分 解 

两 个 实 系数 多 项 式 f(s) 和 g(s), 如 果 其 最 大 公 因 子 是 1, 则 称 f(s) 和 gCs) 互 质 ,或 者 
吏 它 们 没有 公共 的 零点 。 不 难 证 明 ,f(s) 和 g(s) 互 质 的 充分 必要 条 件 是 :存在 实 系 数 多 项 
式 Xx(s) 和 y(s), 满 足 

fls)r(s)i+gls)y(s)=1 (7-28) 

式 (7-28) 称 为 Bezout 等 式 。 

大 f(s) 和 g(s) 表 示 稳 定 的 真有 理 晃 数 , 即 f(s).g(s)ERH™”, 则 f(s) 和 g(s) 互 质 可 
定义 为 :如 果 存 在 x(s)、y(s) ERH” ,使 式 (7-28) 成 立 , 则 f(s) 和 g(s) 互 质 。 

推 而 三 之 ,可 以 定义 矩阵 F(s),G(s)E RH” 的 互 质 性 ;对 于 两 个 稳定 真有 理沙 数 和 矩 阵 
f(s) .G(s)E RH” ,如 果 FF\G 的 列 数 相同 , 且 存 在 瑟 (*). 了 (ERH ,使 得 
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F 
[X 站 | - |=xF+YG=/ (7-29) 


成 立 , 则 严 \G 右 互 质 ， 或 者 说 答 阵 | 。 | 在 RH~ 上 有 左 逆 . 
类 似 地 ,如 果 F(s).G(s)ERH” 的 行 数 相同 , 且 存 在 于 (s)、Y(s)ERH” ,使 得 
[F 0]|, |=Fx+6r=/ (7-30) 


成 立 , 则 王 和 G 左 互 质 , 或 者 矩阵 [FF Gj 在 RH~ 上 有 右 逆 。 
一 个 真有 理 函 数 矩 阵 G, 其 右 互 质 分 解 指 G 二 NM ', 而 N.MERH” 是 右 互 质 和 矩阵 。 
类 似 地 ,如 有 G= 邮 -1'N ,其 中 入 .MERH” 左 互 质 , 则 是 左 互 质 分 解 。 在 上 述 定义 中 ,M 和 
M 是非 奇 异 方 阵 。 
事实 上 ,任何 真有 理 和 矩阵 都 存在 一 种 特殊 的 互 质 分解 , 所 谓 双 互 质 分 解 。 下 面 给 出 双 
互 质 分 解 的 引 理 ，。 
引 理 7-2 考虑 真有 理 和 矩阵 Gl) 二 CCs1 一 A) '8 十 D, 设 其 状态 空间 实现 [4 ,B,C,D 
能 稳 、 能 检测 , 则 存在 8 个 矩阵 
M(s)=[Ar,B,F,I], N(s)=[Ar,B,Cs,D] 
M(s)=[Ag,H,C,I], N(s)=[As,Bu,C,D] 
X(s)—=[Ar,—H,Cr,1], YC(s)=[Ar,—H,F,O0)] 


FX(s)=[An,—BasF,T], YG)=[Ay,—H,F,0] (7-31) 
式 中 
4F 一 4 十 BF， Cr 一 C 十 PDF 
An=A+HC, Ba=B-+-HD 
满足 


(DD 式 (7-31) 中 8 个 矩阵 均 属于 RH”。 
@) M(s).M(s) 是 非 奇 异 矩 阵 。 


(B) z G(s)=N( HM '(s)—=M™ (sONG) (7-32) 
X YrMm 了 
~ ~ 一 有 - 
© x gly x (7-39) 
证 朋 


@ 因为 已 假定 G 的 状态 空间 实现 能 稳 、 能 检测 ,所 以 总 可 以 选择 .及 ,使 
4Fr 一 4 十 有 FF ， As=A+HC 
成 为 稳定 和 矩阵。 因此 ,结论 外 成 立 。 
事实 上 ,者 革 ER”*", 则 


adj(s7 一 在) 
”det(s1 一 于 ) 


式 中 det(s1 一半 ) 是 n 次 首 一 多 项 式 ,而 adj(s1 一 耻 ) 的 每 个 元 都 是 严格 小 于 nn 次 的 多 项 式 ， 
从 而 有 


(sI—X) '= 


limdetM = limdet [7 十 天 (CsT 一 4r) 有] 一 1 
又 知 ， detafG) 是 ， 的 连续 函数 周知 ， ,对 于 方 阵 M(s), 夺 其 行列 式 detM(G 7) 是 有 理 分 式 域 
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上 的 零 元 , 则 M(s) 是 奇异 的 ;反之 ,detM(s) 是 有 理 公 式 域 上 的 非 零 元 , 则 Ms) 是 非 奇 异 
的 。 因 此 ,Ms) 为 非 奇 异 阵 。 类 似 地 , 肝 (s) 也 是 非 奇异 阵 。 
(B 设 G(s) 的 状态 空间 实现 
*=Ax+ 十 Bu 
y=Cx+ Du 
是 能 稳定 的 ,从 而 可 选择 实数 窍 阵 下 ,使 4 十 BF 成 为 稳定 矩阵 。 定 义 v 二 wu 一 fx 及 和 矩阵 
Cr 二 C 十 DF, 则 有 
万 二 和 px 十 Br 
u— Fxty 
y=Crx Dy 
那么 ,由 ”到 ,由 到 y 的 传递 矩阵 分 别 为 
M(s)=|Ars,B,F,1 | 
N(s)—[Ar,B,Cs,D)] 
因此 ,uw 二 MCG)v,y 二 NC)rv ,从 而 得 到 y 二 NG)v 二 NCGS)M TiCGO)wu, 即 GG) 二 NC)M ICG) 。 类 
似 地 ,选择 五 使 As 二 4 十 HC 稳定 ,并 定义 By=B8 十 HD, 可 推 证 出 G(s)== 衣 -1(s)N(s)。 
4) 由 式 (7-33) 可 见 , 为 证 结论 外, 只 须 验 证 以 下 3 个 等 式 : 
l” XM—I=[I—F(sI—Ay) Bs J[1+F(sI—As) BJ]—I 
——F(sI—An) BglI—F(I—As) By |F(sI—A)- 1B 
=——F(sI—Ag) Bt+F[LI—(sI—An) BaF |(sI— Ar) BB 
——F(sI—Ang) ‘ButF(sI—As) [GsI—Ag)— BaF (siI~Ar) B 
~—F(sI—Ay) ‘Bs+F(sI—An) '[(sI—Ar) 
— (HC-+HDF) j(sI—Ar) 1B 
=F(sI—Anx) '[I— (HC+HDF)(sI—Ar) 'J[B—F(sI—An) 'B, | 
=F(sI—As) '[B—H(C+DF)(sI—Ar) 1B~— Bs) 
—[—F(sI—An) 'HJILD-+C(sI—Ar) 1B|=Y(C NGs) 
2° XY =[I—F(sI—As) 'ByJ[—F(sI—A:)-!H) 
—F[I+(sI—An) BgF](s1—Ar) 'H 
=—F(sI—As) '[(sI—An)+BauF il(sI—Ar)-'H 
~——F(sI—An) [sli—Ar— HCs IOsI—Ar) 'H 
——F(sI—As)'[LH— HC:(s1— Azr)-'H] 
=—F(sl—As) 'H[I—Cr(sI—Ar) -HI=YX 
3” 一 NY 十 及 X= 了 可 类 似 地 得 到 证 明 。 
(3) 稳定 性 
1) 外 部 稳定 与 内 部 稳定 。 
动态 系统 既 可 用 输入 输出 关系 描述 ,又 可 用 内 部 状态 描述 。 对 应 于 这 两 种 描述 ,可 定 
义 外 部 稳定 性 和 内 部 稳定 性 。 这 里 ,讨论 稳定 性 的 两 种 定义 .判别 条 件 及 其 相互 关系 。 
Q 外 部 稳定 性 :一 个 因果 系统 ,如 果 加 入 有 界 输入 zi) :aiD)j 委 包 <co,zE [t,o0)， 
产生 的 输出 y(i 也 是 有 界 的 , 即 |7(G)| 委 久 <cotE [co), 则 称 该 因果 系统 是 外 部 稳定 
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的 , 亦 称 有 界 输入 有 界 输出 稳定 , 简 记 BIBO 稳定 。 

讨论 外 部 稳定 性 时 ,假定 初始 条 件 为 零 。 因 为 非 零 初始 条 件 可 以 看 成 是 初始 时 刻 
以 前 有 界 输入 的 作用 结果 。 因此 , 零 初 始 条 件 的 假定 并 不 失 一 般 性 。 知 非 零 初 始 条 件 是 由 
于 扰动 输入 产生 的 , 杂 散 的 扰动 输入 不 能 纳 人 系统 的 输入 输出 描述 之 中 。 下 面 给 出 外 部 稳 
定性 的 几 个 引 理 。 

引 理 7-3 BIBO 稳定 的 充分 必要 条 件 是 系统 的 脉冲 响应 及 () 绝 对 可 积 , 即 


| IC |di<hk<o0 (7-34) 
”” 引 理 7-4 设 多 输入 多 输出 系统 的 脉冲 响应 矩阵 为 G(z) , 则 系统 BIBO 稳定 的 充分 
必要 条 件 是 G() 的 各 元 Bit 一 29371 一 1 2， 力 )， 均 满足 绝对 可 积 条 件 

| | gi;(£) [di 一 co (7-35) 


大 已 知 多 输入 多 输出 线性 定常 系统 的 传递 矩阵 为 G(s) , 则 BIBO 稳定 的 充分 必要 条 
件 是 : 当 G(s) 为 有 理 隆 数 和 矩阵 时 ,GCs) 的 每 个 元 gi(s) 的 所 有 极点 均 具 有 负 实 部 。 
内 部 稳定 性 :一 个 线性 定常 系统 的 状态 空间 描述 为 


+ 二 Ax 十 Bu 
y=Cx+ Du (7-36) 
大 由 任意 x(0)= 二 x。 引起 的 零 输 入 响应 X(t1) ,满足 limx(z) 二 0, 则 称 系统 (7-36) 内 部 稳定 ， 


简称 内 稳定 。 

内 部 稳定 性 指 的 是 在 状态 空间 中 实现 的 Lyapunov 稳定 性 。 讨论 内 部 稳定 性 时 ,必须 
令 控 制 输入 wu(i) 三 9。 如 果 把 初 态 xo 看 成 是 脉冲 输入 的 结果 ,那么 内 稳定 指 :在 脉冲 输入 
作用 下 ,系统 的 状态 渐 近 地 趋 于 零 。 下 面 给 出 内 稳定 性 与 外 部 稳定 性 之 间 的 关系 。 

设 线性 定常 系统 


t=Ax+TBu, xX(0)=xo : (7-37) 
y=Cx+ Du 
是 内 稳定 的 , 则 必 是 BIBO 稳定 的 ;反之 ,车 系统 (7-37) 是 BIBO 稳定 的 , 则 不 能 保证 一 定 


是 内 稳定 的 。 

由 状态 空间 的 结构 分 解 定 理 可 知 , 一 个 状态 空间 实现 通过 非 奇 异 线性 变换 ,可 分 解 成 
能 控 能 观 、 能 控 不 能 观 \ 不 能 控 能 观 以 及 不 能 控 不 能 观 四 个 部 分 ,而 系统 的 输入 输出 描述 ， 
如 传递 矩阵 G(s) 二 Cls1 一 4) “18 十 D 只 表示 能 控 能 观 部 分 。 因 此 ,BIBO 稳定 只 能 反映 能 
控 能 观 部 分 是 稳定 的 ,不 能 反映 其 他 三 部 分 结构 是 否 稳 定 。 从 而 , 仅 当 线性 定常 系统 
(7-37) 能 控 且 能 观 时 ,其 内 部 稳定 和 BIBO 稳定 才 是 等 价 的 。 

从 以 上 分 析 可 知 , 若 系统 (7-37) 是 G(s) 的 一 个 最 小 实现 ,由 于 该 系统 能 控 能 观 , 所 以 
其 外 部 稳定 性 和 内 部 稳定 性 是 等 价 的 ;假设 系统 (7-37) 是 G(s) 的 一 个 实现 , 若 该 实现 是 
能 稳 能 检测 的 ,其 外 部 稳定 性 等 价 于 内 部 稳定 性 , 即 *==Ax 渐 近 稳定 ,等 价 于 GCC) 一 CCsT 
一 4) 8 十 DERH™ ,但 是 ,由 最 小 实现 互联 起 来 的 总 实现 ,往往 可 能 是 非 最 小 实现 。 所 以 
用 系统 的 外 部 稳定 性 判定 总 实现 的 内 部 稳定 性 ,必须 特别 着 慎 。 

(3) 函数 空间 中 的 内 部 稳定 性 与 外 部 稳定 性 ;在 函数 空间 中 ,为 了 对 外 部 稳定 性 和 内 
部 稳定 性 有 具体 和 深入 地 了 解 ,作为 一 个 例子 ,考查 图 7-8 所 示 线 性 定常 反馈 系统 的 稳定 
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性 , 即 考 查 K 使 P 内 稳定 的 条 件 。 
由 图 7-8 可 以 写 出 如 下 方程 : 


bt oy os 
四 网 {739) 


1 一 天 
pi 
有 道 , 则 方程 (7-39) 有 唯一 解 , 称 系统 (7-39) 是 适 定 的 。 图 7-8 反馈 系统 适 定 的 充分 条 件 


为 PP 严格 真 。 
假定 P 满足 严格 真 条 件 , 由 式 (7-39) 可 得 
u I 一 大] 一 TY Vy 
“|= | ,uel (7-40) 

式 中 HC(P,K)ERH” 是 外 部 稳定 ,同时 也 是 内 部 稳定 的 充分 必要 条 件 。 为 证 明 这 一 结论 ， 
假设 Pl(s) 和 K(s) 的 状态 空间 实现 为 

P(s)=[ Ap,Bp,Cp, Dbp| 

K(s)=[Axr,Bx,Cx, Dex| 
且 都 是 能 稳 能 检测 的 ,并 满足 适 定 性 条 件 

lI—K(%%)P(o0)|= 11I~— DrDr|3A<0 

则 图 7-8 系统 的 状态 方程 为 


或 者 


右 和 矩阵 


ee] a 


即 
X= Ax 二 Buo (7-42) 
e=—=Cx+ Duo (7-43) 
uo=Vv 十 Ke (7-44) 
式 中 
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= 
X 一 ， Wo 二 ， ?一 ， 6 二 
XK 了 Y 2 CE: 
由 式 (7-43) 和 式 (7-44) 可 得 : 
e= (1—DF) iCx+ (I—DF) Dr 
us=F(—DF) Cxt+[LI+F(U—DF) 站 
将 uo 代入 式 (7-42), 有 
2 一 4X 十 盏 v 
e 一 CX 十 Dr (7-45) 
式 中 
A 二 BF(I—DF) 'C 
=B[LI+FU—DF) 'D]|=BU—FD) 
=(I—DF) 'C 
: D= (I—DF)'D 
在 推导 B 中 ,应 用 了 如 下 和 矩阵 等 式 : 

(I—FD)LI+F(U—DF) DD| 
=(1I—FD)+(I—FD)F(I—DF) ''D 
~—(I—FD)+F(I—DF)(I~DF) ‘D 
md / 

由 于 系统 (7-41) 能 稳 , 必 和 存在 Ko, 使 4 十 BK。 稳定 。 现 取 
K=(I—FD) (Ko— FC) 


OO Wl x 


则 
A+BK =A+BF(U—DF)-'C+B(U—FD) (I—FD) (Ko—FC) 
=A+BFC+B(Ko—FC)=—A+BK, 

从 而 证 明了 [4,8j] 是 能 稳 的 。 由 [LC,4] 的 能 检测 性 ,可 以 类 似 地 证 明 [C ,4 j 是 能 检测 的 。 

上 述 证 明 过 程 表 明 , 反 馈 系 统 (7-45) 是 能 稳 能 检测 的 , 故 * 二 hx 内 稳定 ( 渐 近 稳定 ) 
与 

W(P,K)=[C(GI—A) :B+D |ERH™ 

等 价 。 可 以 证 明 , 后 者 又 等 价 于 H(P,K) ERH”. 

对 于 图 7-8 反馈 系统 内 外 部 稳定 性 的 讨论 表明 ,内 部 稳定 性 等 价 于 BIBO 稳定 性 , 进 
| 而 等 价 于 传递 函数 矩阵 HC(P,K)ERH” ,不 过 ,这 里 的 
H(P,K) 表 示 闭 环 系 统 的 所 有 输入 到 所 有 输出 的 传递 
函数 矩阵 。 

2) 标准 五 ~ 控 制 问题 的 内 稳定 性 条 件 。 

对 于 标准 态 ” 控 制 问 题 , 为 讨论 图 7-9 所 示 系 统 中 


2 


图 7-9 内 稳定 问题 Kk 使 G 内 稳定 条 件 , 引 进 两 个 附加 的 输入 量 V] 和 Vo 
行将 G 分 解 为 
G= I | (7-46) 
Go (Cz2? 
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则 由 图 7-9 可 以 写 出 如 下 关系 : 


i 一 Ci， 0 < Gi) 0 0 Ww 
0 I ‘| . 一 |0 fT 0||v» (7-47) 
0 一 Co2? I 了 G 0 1 


当 G2 (Cs) 严 格 真 , 即 limCzs(s) 一 0, 必 有 


i 一 人;， 0 
limdet |0 I —K|=]1 
0 —0G,, I 


因此 ,Gz 严格 真是 满足 适 定性 的 充分 条 件 。 今后, 我们 总 假定 Gz: 严格 真 。 这 时 ,由 式 (7-47) 可 得 


Z 7 —G,, 0 1717irG6, 0 Ofw w 
， 7 ~ 0 7 0llvy|=H(G,K) 。 (7-48) 
y 0 一 (7，， G, 0 1 Lyn， ? 
若 H(G,K)ERH” 空 间 , 图 7-9 系统 内 稳定 。 现 讨论 基于 G、K 互 质 分 解 的 内 稳定 判别 
条 件 。 
将 广义 被 控 对 象 CCGs) 和 控制 闫 六 Cs) 作 互 质 分 解 
C 一 NA 一 有 -IN (7-49 ) 
玉 一 DY 一 YI (7-50) 


在 式 (7-49) 和 式 (7-50) 条 件 下 判断 内 稳定 ,有 如 下 结论 。 

引 理 7-5 对 于 图 7-9 反馈 系统 ,由 wm 到 zuyy 的 九 个 传递 函数 矩阵 属于 RH 
空间 的 充分 必要 条 件 是 图 7-10 系统 由 mw,m，,m% 到 £6,n 的 六 个 传递 函数 矩阵 属于 RH” 
空间 。 

将 图 7-9 系统 中 的 G 和 按 式 (7- 
49) 和 (7-50) 的 互 质 分 解 , 分 成 N.M 'U 
和 和 V-! 四 块 , 则 图 7-9 系统 转化 成 图 7-10 
系统 ,图 中 引进 两 个 新 的 信号 6 和 7。 则 有 
如 下 定理 。 

定理 7-1 对 于 图 7-9 系统 及 其 等 价 
系统 图 7-10, 如 下 说 法 等 价 : 


中 天 使 G 稳 定 。 
M 
> | 
[0 7 门 N 
M 
- ] 
VL0 71] 


证 明 ”为 证 明定 理 中 以 和 @ 的 等 价 性 ,首先 证 明 书 中 和 矩阵 的 非 奇 异性 , 即 逆 和 矩阵 存在 
且 是 一 个 有 理 和 矩阵 。 因 为 


*° 245 * 


0 0 
M Mb I |， KIrM 0 M 0 
0 V 0 Vv 
[0 TIN V [0 IT]G I Gs Co J 


(7-51) 
由 于 M 和 YY 是 非 奇异 矩阵, 目 C:: 严 格 真 ,因此 式 (7-51) 右 边 的 两 个 和 矩阵 均 为 非 奇 异 阵 ; 
式 (7-51) 左 边 的 和 矩阵 也 是 非 奇 异 的 ,是 为 有 理 消 数 矩 阵 。 
由 图 7-10 可 以 写 出 如 下 关系 : 
0 Ww 
人 9 |- 时 


—[0 / TIN V 


4 i 
一 [0 TN V y, 


根据 引 理 7-5,K 使 G 内 稳定 等 价 于 


0 一 | 
| 
I ERH™ 


[oIN vy 


90] 31-1 
| M a ERH™ 
z [0 IIN Vv 
因此 ,中 和 怨 的 等 价 得 到 证 明 。 同 理 , 可 以 类 似 地 证 明 中 和 图 的 等 价 性 。 

3) G(s) 的 能 稳定 性 。 

如 果 和 存在 一 个 真有 理 孙 数 和 矩阵 使 G 稳定 , 则 称 G 能 稳定 。 并 非 任 何 G 都 是 能 稳定 
的 ,比如 式 (7-46) 分 块 逢 阵 , 奋 G1 二 0,Gz= 二 0, 而 Gi 不 稳定 , 则 G 是 不 能 稳定 的 ,因为 这 
时 G 的 不 稳定 部 分 与 u,y 均 无 关系 。 

就 状态 空间 模型 而 言 , 当 且 仪 当 不 稳定 模 对 于 w 是 能 控 的 (能 稳定 性 ) ,对 于 y 是 能 观 
测 的 (能 检测 性 ), 则 G 是 可 稳定 的 。 下 面 讨论 基于 6G 的 左 . 右 互 质 分 解 的 能 稳定 性 的 判 
据 , 即 由 


名 


进而 等 价 于 


G=NM =M-!N 
讨论 依据 N .MA 或 六 .好 判断 G 的 能 稳定 性 的 条 件 。 
引 理 7-6 设 M .NERH” ,其 列 数 相 等 , 则 枚 和 六 在 RH 空间 右 互 质 的 充分 必要 条 
件 是 ;存在 U,VERH”™ ,满足 
| U 
z Ny 
引 理 7-7 设 M.NERH” ,其 行 数 相等 , 则 MM 和 NN 在 RH” 空 间 左 互 质 的 充分 必要 条 
件 是 :存在 UVERH™ ,满足 
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一 1 
| ERH” (7-52) 


N 
U Vv 
定理 7-2 下 面 的 条 件 是 等 价 的 : 

QD G 能 稳定 。 


0 
2) M 和 [0 IIN 右 互 质 ,M 和 | ”0 左 互 质 。 


一 ] 
] enr 


(3) 认 . 太 | ，| 左 互 质 , 府 .[ TN 右 互 质 。 


证 明 证 明 心 和 包 的 等 价 性 , 先 证 局 到 他 ) 。 
如 果 G 能 稳定 , 依 定理 7-1, 存 在 UVERH”™ ,满足 


0 一 ] 
a [ob 
i 


[0 I]N Vv 


ERH® 


再 依 引 理 7-6 和 引 理 7-7 可 知 :M.[0 LIN 右 互 质 ;MM、 半 左 互 质 . 根据 MM、 i 左 互 
质 , 则 有 


因此 ,M、| ?|v 左 互 质 。 
再 证 名 到 Q。 由 M.L0O 7TJN 右 互 质 以 及 引 理 7-6 ,存在 X.Y 了 ERH= ,满足 


| jw | sRHr 


又 由 7、 | ，| 左 互 质 ,选择 RTERH=~ ,满足 


或 
MR 十 | ， | 一 / (7-53) 
现 定义 
U=TX (7-54) 
V=Y—[0 IINRYX (7-55) 
则 
| M < | M xX—MREY 
[0 IIN Yjl@ I J lire DDN 7 一 [0 NR 
-| M (TIT— MR)X 
“lro IN 7 一 [0 DR 


”247。， 


0 
-| W 人 (7.58) 
式 (7-56) 左 边 两 个 矩阵 有 逆 , 即 


I —RX] 
erp 
0 1 


因此 , 式 (7-56) 右 边 矩 阵 满 足 


ne 
7J IE€ERH (7-57) 
[0 IIN Vv 

由 式 (7-54) 和 式 (7-55) 知 :UVERH™。 夺 能 证 明 UV 右 互 质 , 且 V 存在, 则 取 天 三 
UV ,又 满足 式 (7-57) ,根据 和 定理 7-1 可 知 ,这 样 的 K 可 使 G 稳定 .下 面 要 证 明 V :存在 以 


及 UU 与 V 的 右 互 质 性 。 
证 明 V 和 存在, 即 证 明 V 非 奇异 :由 于 


0 0 
" J - ' LP oo oo] om 
[TO TIN Vy [0 IG Vv Gr G2 V 
并 考虑 到 已 经 假设 Gz 严格 真 ( 这 是 保证 标准 鼠 " 控 制 问题 适 定性 的 充分 条 件 ) ,在 *= co 


点 上 取 式 (7-58) 两 边 行列 式 , 再 考虑 式 (7-58) 左 边 矩 阵 的 非 奇 异性 以 及 有 可 道 (detM 
(ce) 天 0), 则 有 detY(coe)detM (co) 天 0。 于 是 有 detV (oo) 隆 0, 从 而 证 明了 V7 存在。 


证 明 U 和 VV 的 右 互 质 性 : 记 


i 0 0 


w [ol 


[0 IIN Vv 


| “| Wa 


[x J _ - 
x[°] re] 


从 而 ,UV 和 VV 互 质 得 证 。 至 此 ,证 明了 忆 到 (DD。 同 理 , 可 类 似 地 证 明 Q 叫 与 @ 的 等 价 性 。 
今后 ,始终 假设 G 是 能 稳定 的 。 直 观 上 ,G 能 稳定 意味 着 G 与 GB 有 相同 的 不 稳定 极 
点 。 所 以 ,稳定 G 只 要 稳定 G4 即 可 。 因 此 ,有 如 下 结论 ; 
通常 ,KK 使 G 稳定 ,是 指 由 w,vi ,vz 到 z,u,y 的 九 个 传递 函数 矩阵 属于 RH”, 而 KK 使 
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式 中 X,Y 了 ERH™, 则 有 


Gz 稳定 , 则 指 由 vi ,vs 到 w,y 四 个 传递 函数 矩阵 属于 RH™。 

引 理 7-8 在 图 7-7 中 ,由 yy ,vs 到 zy 的 四 个 传递 函数 矩阵 属于 RH” ,等 价 于 图 7-8 
中 从 mv 到 6,n 的 四 个 传递 函数 矩阵 属于 RH 。 

定理 7-3 天 使 G 稳 和 定 的 充分 必要 条 件 是 天 使 C:: 稳 定 。 

证 明 ”必要 性 显然 ,只 需 证 明 充 分 性 ,假设 使 G,: 稳 定 , 为 证 明 K 使 G 稳定 ,只 需 证 
明 图 7-8 中 wz 到 65,7 的 六 个 传递 函数 矩阵 属于 RH”。 由 引 理 7-8 可 知 , 由 yw 到 
56,7 的 四 个 传递 矩阵 属于 RH™Y, 剩 下 只 需 证 明 由 w 到 6,n 的 两 个 传递 矩阵 属于 RH” 即 
可 。 以 下 证 明 从 略 。 


7.3.4 模型 匹配 问题 


(1) Youla 参数 化 

定理 7-3 指出 ,在 标准 召 " 控 制 问题 中 , 使 G 内 稳定 等 价 于 使 Gz 稳定 .下面 讨论 
K 使 Gs 内 稳定 问题 ,对 应 的 方 框图 如 图 7-11 
所 示 。 为 简化 符号 ,以 下 去 掉 下 角 标 ,以 G 表 ”Cc 
示 GO,,。 

将 图 7-11 中 的 G 作 双 互 质 分 解 ,K 作 互 
质 分 解 , 即 


/ : 图 7-1] G2: 内 稳定 问题 
~—NM '—M-iN (7-59) 


G 
J "= 7-60) 
一 六 ILN 于 
K=UV ~—Y- (7-61) 
则 有 与 定理 7-1 相 类 似 的 结论 。 
引 理 7-9 下 列 说 法 等 价 : 
QDK 使 6 稳定。 
M UY-! 
© | ,| ERH” 
V V1 
3) |_ | ERH= 
证 阴 略 。 
定理 7-4 使 C 稳 定 的 所 有 真有 理 阵 天 ,可 用 如 下 参数 化 公式 表示 ， 
于 一 (了 一 MOQ) (X 一 NO) = (XX—QON)-'(Y?— OM) (7-62) 


式 中 QE RH™ ,使 (外 一 NO)、( 这 一 OQ) 可 道 。 
证 明 分 如 下 三 步 证 明 。 
QD 证 明 等 式 (7-62)。 令 QERH™, 且 满足 (XY 一 NO) 和 (这 一 QO 记 ) 可 逆 。 由 式 (7-60), 有 


os a J = 
BB 
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g_o (YO 一 1 
四 OY i > |=/ (7-63) 


—N M N 一 NO 
由 式 (7-63) 左 右 两 边 分 块 矩 阵 的 (1 ,2) 分 块 相等 ,得 到 
(XY—QON) (TY—MO)= (YF—OM)(X—NO) 
于 是 , 式 (7-62) 得 证 。 
@ 再 证 由 式 (7-62) 给 定 的 能 使 G 稳定 。 定 义 
/ U=Y—MO, V=X—NO 
U=Y?Y—0M, V=X—ON 
由 式 (7-63) 得 


Ca 


V 一 3]raMf 7 
| | = (7-64) 
-A 有 JJLN V 
式 (7-64) 表 明了 与 Y 右 互 质 ,三 与 Y 左 互 质 , 且 
了 
vy v) sRa 
根据 引 理 7-9, 可 知 下 使 G 稳定 。 
(3) 最 后 证 在 外 使 G 稳定 时 ,对 于 某 些 OE RH”™,K 满足 参数 化 公式 (7-62)。 令 KK 二 


UV "是 一 种 右 互 质 分 解 ,用 UU 和 V 代替 式 (7-60) 中 的 了 和 无, 则 有 


| |” |=| | (7-65) 
Nm MJLN YJ lo fy—NU 
根据 引 理 7-9, 有 
eatr 
NV 
所 以 , 式 (7-65) 左 边 两 个 矩阵 均 为 RH” 空间 的 可 道 和 矩阵 ,其 右边 矩阵 也 是 RH= 空 间 的 可 
逆 矩 阵 , 即 
| | 一 ~ leRH” 
0 jyv—NU 0 (MVv—NU)-! 
从 而 得 到 z : 
(MV—NU) ERH™ (7-66) 
现 定 义 


Q=— (XU—YVy) (MV— NU)-! 
可 知 ,QERH™~。 式 (7-65) 可 改写 成 
LT ?IFTM U 7 —O((MV-NU) 
ee. x Ly y= (Mv— NU) | (7-67) 


式 (7-67) 左 乘 | 。 ， |, 并 考虑 到 式 (7-60) , 则 得 
yy vy x gy ro, 
从 而 有 
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[7]- [了 WO)CAY 一 AD 


一 ~ ~ 《7-68 ) 
(XX—NO)MV— NU) 


V 
将 式 (7-68) 代 入 下 ,并 考虑 到 式 (7-66), 则 得 
K=UV =(Y— MO)(X—NO) 
从 而 证 明了 使 G 稳定 的 ,必须 具有 式 (7-62) 的 形式 。 
注 记 : 
QO 对 于 每 一 个 OERH” ,通常 都 能 满足 (对 一 NOQ) 和 (证 一 QN) 可 道 的 条 件 , 因 此 ,一 般 
只 要 求 QE RH™， 
(2 将 G 作 双 互 质 分 解 后 ,每 一 个 QOERH” , 按 式 (7-62) 确 定 的 天, 均 可 保证 使 G 稳 
定 。 央 此 ,通过 式 (7-62) 可 将 @QERH” 上 映射 成 使 C 稳定 的 下 ; 反 过 来 ,使 C 稳定 的 所 有 KK， 
均 可 用 式 (7-62) 表 述 。 所 以 ,有 时 称 式 (7-62) 是 使 G 稳定 的 的 参数 化 公式 。 : 
为 了 更 进一步 理解 使 G 稳定 的 K 的 结构 特点 ,从 式 (7-62) 出 发 ,通过 如 下 推演 给 出 
参数 化 公式 的 男 一 种 形式 。 z 
K =(Y—MO)(X—NO) '=Y(X—NQO) '— MO(X—NO)-! 
~=Y¥ (XX—NO+NO) (FX—NO) !— MO(X— NO) 
~YX ‘LI+NO(X—NO) !]— MO(X— NO)-! 
一 YX 十 YX INQO(X—NO)-'— MO(X— NO) 
=YX + (XYN—M)QU— XINO) YX! 
—YX '—X '(XM—YN)Q(U—X INO) 一 
~Y¥X '—¥ OC(—¥-INO)-!¥-! 


=Ko—X Q(T~X-INO) XT ! (7-69) 
式 中 K,=YX '， 
由 式 (7-69) 可 见 ,K 是 8 的 线性 分 式 变 换 , 如 定义 
下 一直: 
六 [各 Co 
¥-! 下 -IN 


则 由 式 (7-70) 给 定 的 控制 器 方程 为 
4 一 FTQ)y 一 [天 ,一 XIQCT 一 和 -INQ)-IX-I]y (7-71 ) 
式 (7-71) 可 以 看 成 如 下 系统 的 输入 输出 关系 ， 


= = wn ] (7-72) 


y=Qu, QERH™ (7-73) 
对 应 的 系统 方 框图 ,如 图 7-12 所 示 。 
式 (7-71) 和 图 7-12 表明 , 若 0 二 0, 则 
K—K,=YX¥”! (7-74) 
及。 是 使 G 稳定 的 特殊 控制 器 。 式 (7-74) 中 的 了 
和 天 满足 式 (7-60)。 因 此 有 
M Yi 
|» | 和 RH 图 7-12 系统 方 框图 
根据 引 理 7-9, 特 定 的 控制 器 太一 YX-: 使 G 稳定 是 很 明显 的 。 


"25] 。 


(2) 模型 匹配 问题 
对 如 图 7-2 所 示 的 标准 五 "控制 问题 ,将 C: 作 双 互 质 分 解 


G»,=N,.M;'= M7;!'N, (7-75) 
下 一- M, 了 
| -| |=7 (7-76 ) 
—N, M, .JLN, X, 
根据 式 (7-62) ,使 Gs 稳定 的 为 
K=(Y,— M0)(X,— M0) '= (X,— ON,)-(Y,—OM,.,) (7-77) 


将 式 (7-75) 和 式 (7-77) 代 入 UU 一 KG,,)-!, 并 考虑 到 式 (7-76) ,得 
(I—KG»,) :=[1— (XK,—OQN,) (7,—OQOM) NM 

一 | (一 ON '[(X,—OQON,)M,— (Y,—QM.,)N, IM } 

= {(¥,—QN,) (KM,—YN,—Q(NM,— MN,) M3 )} 

一 AM (一 ON，) 
而 

(I— KG,.) 'K=M,(Y,—OM,) (7-78) 
考虑 到 天 (7 一 G2K)- 一 (7 一 KG 天, 并 将 式 (7-78) 代 和 人 下 式 ， 
z 一 | CN 十 GCT 一 氏 C 1I 民 CC lw 


一 [G 十 GE 一 0O 李 7G jw= (Ti —T,0T;)w (7-79) 
则 : 
T,,=T,—T,07, (7-80) 
式 中 
T=Gn GM,Y,G,, (7-81) 
f=—G»M, (7-82) 
7 ,= M,G, (7-83) 


为 实际 计算 T;(; 二 1,2,3) ,并 证 明 T,ERH” ,下 面 推导 7TG=]1,2,3) 的 状态 空间 表达 式 ， 
对 图 7-2 系统 ,将 G 的 最 小 实现 G 二 [4,8,C,D] 按 输入 输出 | |] 和 | | 的 维 数 分 块 


则 有 
CO D',, D, 
BB C, D, D; 
A : B, B, 
G(s)= IC : DD DD, 
C: : Ds D,, 


G,;=|A,B,,C.,D;;], i=1,2 

G 的 可 稳定 条 件 是 [4,8B; | 能 稳 ,LC;,A4j] 能 检测 ;由 Gzz(s) 严 格 真 可 知 ,Dzs 二 0。Gzs 的 双 互 
质 分 解 

G2» = NM; '= Mi'N, (7-84) 
式 中 

M,=|[Ar,B,,F ,1 

N,=—LAr,B:,C2,0) (7-85) 

M,=[As,H,C,,1] / 
N :LAn,B,,C,,0) 
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As=A+B,F, Ax=A+HC; 

X,=[LA:,—H,C;,1 |, ,=[An,—B,,F ,| 

Y,=[As,—H,F,0], YY,=[An,—H,F,0| 
将 式 (7-85) 代 和 人 式 (7-81) 一 式 (7-83) ,经 推演 可 得 


=-[4,8,C,D]=| | elit | pp [CHDuaF —DysF],Dn] (7-86) 
T,=[An,B,,Ci+ HDiF Dj (7-87) 
T,;=[An, B+ HD ,C,, D2 | (7-88) 

以 式 (7-87) 为 例 , 其 推演 过 程 如 下 : 
: A BF 8, 
T, ~=GM;,—[A,B,,C,D', [As,B,,F ,1 |— 4r 
CDPoF Ds 


4 0 0 
-1 A BB， (gL /相似 变换 | [Ar ,Bs, C+ DisF , Dis] 
C, CitDyuF Di | 
式 (7-86) 一 式 (7-88) 表 明 ,T1、T,、T;E RH”。 上 面 论证 结果 可 归结 为 如 下 结论 ;应 用 
K 的 参数 化 公式 (7-77) 。 使 标准 本 ”控制 问题 


min { | G1 GK —GK) Co | oo IK 使 G 稳定 | 


或 
min { | Ci 十 Ci 一 下 Coz) KG, | co IK 使 G 稳定 ) 
转化 成 如 下 模型 匹配 问题 


min | 7 —T.QT; | ~ 
QER 


式 中 TT,、T，ERH™”， 

在 标准 问题 中 ,了 -是 天 的 非 线 性 函数 .而 在 模型 匹配 问题 中 ,7 是 @ 的 放射 性 函数 。 
将 标准 五 "控制 问题 化 成 模型 匹配 问题 ,为 求解 | 7 | -~ 极 小 化 带 来 极 大 方便 。 式 (7-86) 一 式 
(7-88) 表 明 , 只 要 选择 FH 使 ATBF, 4 十 HC; ,成 为 稳定 矩阵 ,很 容易 求 得 工 |、 T,、T; 的 
状态 空间 实现 。 


7.3.5 标准 HH 控制 问题 的 求解 


以 上 我 们 人 研究 了 标准 瑟 ” 问 题 。 在 图 7-2 所 示 的 系统 中 , 为 外 部 信和 号 (包括 参考 输 
和 人、 执 动 .噪声 等 ), 为 控制 输入 ,y 为 观测 信号 ,z 为 广义 控制 误差 ,K(s) 为 控制 器 ,G(s) 
为 广义 被 控 对 象 (包括 实际 被 控 对 象 , 加 权 函 数 及 评价 函数 等 )， 并 可 表 不 为 


G11 (5) 2 |= 
G(s) G(s) 


和 


Ci : :Di D,, 
C, : Ds D2 


co=| 


由 也 至 z 的 闭环 传递 函数 矩阵 为 
T,,(s)=GnC) TG GOKCG) I—G,, COK(C) | 1G, Cs) (7-89) 
所 谓 标 准 怠 ” 问 题 , 就 是 判别 是 否 存 在 使 闭环 系统 内 部 稳定 ,同时 使 得 
| TCs) | ~ <7 (7-90) 
成 立 的 控制 器 。 和 铬 存 在 , 则 求 出 相应 的 控制 嚣 久 (s)。 满 足 式 (7-90) 的 KG(s), 称 为 右 ”“ 次 优 
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控制 器 ,使 上 TG) -= 一 min 的 KG) 称 为 玖 "最 优 控制 天 。 
K 使 G 稳定 的 充 要 条 件 是 使 Gs: 稳定 。 将 C: 互 质 分 解 如 下 ， 


G,, = NM;'= Mi'N,, NM AN MERH” (7-91) 
根据 著名 的 Youla 稳定 补偿 器 的 参数 化 方法 ,控制 器 下 可 表示 为 
K=(Y—MO)(X—NO) =(X—ON) '(Y—0OM) (7-92) 


式 中 省 略 了 下 标 2 及 22;QE RH™ , 称 为 自由 参数 ;天 .了 .站 ERH” , 且 满 足 
TT YM 了 z 
gy By x ‘7-93) 
因此 ,在 设计 H” 最 优 控制 器 时 ,可 以 利用 自由 参数 0 确定 满足 式 (7-90) 的 K, 将 式 (7-92) 
代入 式 (7-89) ,得 | 
TCs)=T, (5) —T,(3)Q06)T,() =T, —7,07; (7-94) 
式 中 : | 
T=Gun GMYG,, 
T,=GM 
T,= MG,, 
这 样 ,标准 鼠 ” 问 题 就 转化 为 求 使 式 (7-94) 的 鼠 ” 范 数 小 于 7 的 OERH” 的 问题 ,又 称 了 刁 ~ 
模型 匹配 问题 。 
一 般 的 跟踪 问题 .稳定 鲁 棒 性 问题 均 可 转化 为 标准 五" 问题。 在 频 域 中 ,标准 瓦 "问题 
的 解法 有 
1) 基于 过 近 理 论 的 解法 。 
这 种 解法 的 基本 思想 是 先 利 用 稳定 化 控制 器 的 Youla 参数 化 ,将 对 于 控制 器 为 非 线 
性 的 优化 问题 化 为 对 自由 参数 为 线性 的 模型 匹配 问题 ,再 将 其 化 为 一 般 距离 问题 , 它 是 函 
数 晕 近 理 论 中 Nehari 问题 的 推广 ,可 解析 地 求 出 最 优 控制 器 。 
2) 基于 插值 理论 的 解法 。 
采用 木村 等 提出 的 所 谓 共 斩 化 方法 ,其 主要 思想 是 通过 选择 控制 器 ,使 闭环 系统 满足 
J 无 损失 条 件 。 
以 上 解法 算法 复杂 ,计算 量 大 ,所 求 得 的 控制 器 阶 次 较 高 ,不 便于 工程 应 用 。 


7.4 三 ”最 优 控制 的 直接 状态 空间 法 


本 节 介 绍 直接 状态 空间 法 。 这 种 方法 是 直接 利用 (广义 ) 被 控 对 象 的 状态 空间 描述 来 
设计 控制 露 ,而且 具 有 如 下 特点 : 

J 算法 简单 ,计算 量 小 ,每 次 迭代 仅 需 解 两 个 与 (广义 ) 被 控 对 象 同 阶 次 的 Riccati 方 
程 。 

@ 可 以 给 出 简明 的 控制 器 存在 的 充分 必要 条 件 。 

G) 控制 着 的 阶 次 等 于 (广义 ) 被 控 对 象 的 阶 次 。 

4 显示 出 控制 器 的 结构 分 离 特 性 。 

@B) 表明 LQG/H? 控制 器 是 巨 ~ 控 制 器 的 一 个 特例 。 

下 面 做 一 些 数学 准备 .然后 ,介绍 状态 反馈 太 ” 控 制 器 的 设计 方法 ,以 及 输出 反馈 五 


* 254. 


控制 器 的 设计 方法 ;最 后 把 这 些 方法 与 LQG/H? 控制 方法 进行 比较 。 
7.4.1 几 个 引 理 
今 A4.0O 和 RR 为 nXn 维 实 和 矩阵 ,0 和 有 R 为 对 称 阵 。 定 义 22X22 维 Hamilton 矩阵 


A R 
一 有 
假设 五 在 虚 轴 上 没有 特征 值 , 则 H 的 特征 值 分 布 对 称 于 虚 轴 和 实 轴 , 且 其 与 位 于 左 半 s 


平面 特征 值 对 应 的 模 态 子 空间 X_(B7) 和 大 |, | 互补 。 则 对 应 的 Riceati 方程 
X4 十 4 下 十 天 RE 一 CO 一 0 

有 唯一 解 。 

记 dom (Ric) 表 示 满 足 这 一 条 件 的 H 的 集合 ,对 应 Riccati 方程 的 解 记 作 玉 = 
Ric( 豆 ) ,并 以 I,.L4 | 表示 4 的 列 向 量 所 张 成 的 子 空间 

引 理 7-10 设 HEdom(Ric), 于 =Ric(H), 则 

(D 站 为 对 称 阵 。 

@Q) 于 满足 Riccati 方程 CARE) ATAXTXRY OT. 

@ A 十 RX 为 稳定 阵 。 

对 于 给 定 的 有 理 函 数 阵 GG) 王 [4,B,C,0] 及 7>>0, 定 义 Hamiltom 矩阵 如 下 ， 


了 ppT 
| A | 


CC 一 4 
Hamilton 矩阵 是 状态 空间 直接 解法 的 一 个 基本 概念 。 这 种 解法 主要 基于 如 下 基本 事实 。 
引 理 7-11 设 有 4 为 稳定 阵 , 则 如 下 命题 等 价 : 
QW Gl.<7, 
凶 豆 的 特征 值 实 部 均 不 等 于 零 。 
(GB) Riccati 方程 


A'¥ TXA+ 却 XBB™Y +C'C=0 (7-95) 


具有 半 正 定 解 了 之 0; 者 [C,A] 可 观 , 则 对 之 0。 

当 D 关 0, 1 -< 等 价 于 适当 的 严格 真有 理 函 数 阵 的 马 ” 范 数 小 于 1 ,或 等 价 于 推 
厂 Hamilton 矩阵 的 特征 值 实 部 均 不 等 于 零 。 此 时 , 引 理 7-11 中 的 命题 国 可 放宽 为 左 端 为 
侦 的 Riccati 不 等 式 。 

引 理 7-12 设 

A 一 BBT 
4=| core yi 

式 中 [4,8Bj 能 稳 , 若 LC,4j] 能 检测 , 则 HE dom (Ric), 革 二 Ric(H) 宇 0; 若 [C,4] 能 观 , 则 
X>0。 

引 理 7-13 考虑 系统 

区 =Ax 十 Bu 
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yy 一 CX 十 Dr 
式 中 4 为 稳定 阵 . 则 6GG) -= CCI 一 4) -1:8 十 D1 过 7Y( 条 件 4) 成 立 的 充分 必要 条 
件 是 
R=7YI—D'D>0 
且 方 程 
P(4 十 BR-IDIC) 十 (4 十 BR IDIC) PP 十 PBR 'B P+C (0 十 DR-ID )C 十 er 一 0 
对 于 充分 小 的 es 之 0, 有 正定 解 P 盖 0。 
引 理 7-14 条 件 4 成立 的 充分 必要 条 件 是 
@ R=7:I— DD>0。 
如 下 两 个 等 价 条 件 之 一 成 立 
1” 定义 
A+BR-'D'™C BR-1BT 
oa 一 ABR DC) 
则 HE dom(Ric), BH Ric(H) 守 0, 
2” 满足 方程 
P(ATBR ID C) 十 (4 十 有 DR-IDIC)IP 十 PBR-IBIP 二 CICT 二 DR-IDIDIC=0 
且 使 
4 一 4 十 BR 'D C+BR 'B'P 
为 稳定 阵 的 正 半 定 阵 P 宇 0 存在。 


7.4.2 状态 反馈 及 ”控制 
考虑 如 下 (广义 ) 被 控 对 象 


z=Cx+ Dw Du (7-96) 
y=Cxt Dw z 
式 中 XxXER" ,wuE R",wE R" ,ZE Rm,yE R*,[A,B,] 能 稳 ,[C,,4] 能 检测 。 假设 D2 二 0。 对 
于 也 :天 0 的 情形 ,可 以 做 一 简单 变换 ,使 之 成 为 D;, 二 0 的 形式 。 
状态 反馈 娓 "控制 问题 是 对 系统 (7-96) 在 状态 x 可 测 得 的 情况 下 ,要求 一 状态 反馈 
u 一 Kx, 使 得 闭环 系统 满足 如 下 条 件 : 
(条 件 SF) TCs) 二 7, 且 (4 十 BsK) 为 稳定 阵 , 式 中 
Tj(s)= (C+DuK)(sI—A— BK)- B+D, 
定理 7-5 假设 系统 (7-96) 满 足 : 
(D D,=D,,=0. 
CC Di,s[C, D1: |=|0 7 |。 
(3) [4 ,8, | 能 稳 ,LC: ,4 能 观 。 
d) u=Kx. 
则 系统 (7-96) 可 表示 为 
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=Ax+ Bwi+B,u 
z=Cx+ Du 
y=Csx Dw 
u—Kx 


(7-97) 


由 w 至 Zz 的 闭环 传递 函数 埠 阵 为 

T,,= (CC) 二 Di,K) (si— A— B,K) 1B, (7-98) 
如 果 (4 十 BsK) 为 稳定 阵 , 那 么 由 引 理 7-11 可 知 , Tw 过 7 的 充 要 条 件 是 Hamilton 
矩阵 


ye | A+ BK BBT | 
— (Ci+DIKRK) (C+DK) — (4BK) 
的 特征 值 实 部 均 不 为 零 。 
车 定义 Hamilton 矩阵 如 下 ;， 
 _- | 4 元 BT 
—CIC, —AT 


可 以 证 明 , 当 理 ,€ dom (Ric) 时 , (4 十 BBIX。) 为 稳定 阵 , 其 中 守 。= 二 Ric(H..)。 自 当 二 
一 BX 时 ,HH 与 Hx 相似 。 因 此 ,上 Tw 上 。 二 7 的 充 要 条 件 是 H.,€ dom (Ric)。 
上 述 | 7 站 -<”, 且 状态 反馈 阵 于 存在 的 充分 必要 条 件 可 等 价 为 :对 于 充分 小 的 
e 盖 0,Riccati 方程 
ATP+PA+Y™P(BBI—YB,BI P+CIC +el=0 (7-99) 
有 正定 解 P>0, 状 态 反馈 阵 
K=—BIP (7-100) 
定理 7-6 ”对 于 系统 (7-96) , 重 Di 一 0,D1; 二 0, 则 满足 条 件 SF 的 存在 的 充分 必要 
条 件 是 :对 于 充分 小 的 二 0, 方 程 


ATP+PA+ -3 ysP eB iB!: —7:B,Bi)P++CIC,-+el=0 (7-101) 
存在 正定 解 P 放 0, 这 样 的 Ee 和 P 在 在 时 ,有 
__l1,r 
K= peB2P (7-102) 


定理 7-7 ”对 于 系统 (7-96) ,各 D1 二 0, DisC1 二 0,DisDis= 二 1, 且 [Ci,A4] 能 检测 , 则 满 
足 条 件 SF 的 天 存在 的 充分 必要 条 件 为 如 下 两 个 等 价 条 件 中 任 一 得 以 满足 : 

(D 定义 

A 7-2B.BI— B,Bl 
oe a | 

有 HEdom(Ric), 8 Ric(H) 守 0。 

(2) Riccati 方程 

A P+PA+Y ‘PBB'P—PB:BiP+CiC=0 (7-103) 
存在 半 正 定 解 P 衬 0, 且 (4 十 YB,BTP 一 B,BIP) 为 稳定 阵 。 
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当 上 述 条 件 之 一 成 立时 ,P=Ric(E) ,而 状态 反馈 阵 
K=—BP (7-104) 

上 面 介 绍 了 在 状态 可 测 的 情况 下 ,利用 定常 状态 反馈 (Kk 为 常 阵 ) 的 万 ”控制 器 的 设 
计 方 法 。 但 是 可 以 证 明 , 定 党 状态 反馈 所 能 达到 的 最 小 7 与 动态 状态 反馈 (K 为 实 有 理 茹 
数 阵 ) 所 能 达到 的 最 小 7 相等 ,甚至 号 非 线性 时 变 状态 反馈 所 能 达到 的 最 小 7Y 相等 。 

利用 上 述 结果 来 设计 状态 反馈 万 "控制 器 步骤 如 下 : 

Q@ 任意 选取 y 盖 0 和 充分 小 se 盖 0。 

凶 ) 检查 使 条 件 SF 成 立 的 K 存在 的 充 要 条 件 式 (7-99) ,或 式 (7-101) ,或 式 (7-103) 是 
否 成 立 。 

1° 者 不 成 立 , 增 加 ”返回 他。 

2° 者 成 立 , 且 迭代 增 量 已 足够 小 , 则 转 下 步 ; 否 则 , 减 小 7, 返 回 @。 

3° 由 式 (7-100) ,或 式 (7-102), 或 式 (7-104) 计 算 K。 


7.4.3 状态 反馈 五 "控制 与 LQ 控制 的 比较 


假设 所 考虑 的 被 控 对 象 不 同 于 式 (7-96) 描 述 的 广义 被 控 对 象 ,而 由 下 式 描述 
X= AXxX 二 Bu 
y=Cx 
评价 函数 为 
J= | xTQx tuTRu)dt 


式 中 Q 一 Q 二 0,R 一 R 二 0, 且 [LO ,4] 能 检测 。 周 知 ,使 J 最 小 的 状态 反馈 阵 KCu 一 Kx) 
为 
K=—R 1'B'P 
式 中 PP 为 如 下 Riccati 方程 的 解 
4 P 十 P4 一 PBR 'B'P+O=0 
对 于 定理 7-7 所 考虑 的 情形 ,在 等 价 条 件 @ 的 Riccati 方程 (7-103) 中 , 令 7Y 一 oo0, 则 所 
得 到 的 ”状态 反馈 矩阵 , 恰 是 R=1,0==C1CY ,B==B; 时 的 LQ 状态 反馈 矩阵 .显然 ,对 于 
RI 的 一 般 情形 ,通过 对 w 进行 坐标 变换 ,也 能 得 到 相应 的 结论 。 
下 面 比较 一 下 状态 反馈 五 "控制 系统 和 LQ 控制 系统 的 鲁 棒 性 。 
对 于 LQ 控制 , 令 R==1, 且 定义 回 差 矩阵 
D(s)=1—K(s1t—A) 'B 
则 
D'(—jw)DOUw)I, VwER 
由 此 可 知 ,LQ 控制 系统 的 增益 裕 量 为 1/2 至 co, 而 相位 裕 量 大 于 等 于 60"( 请 参阅 
B.D. 0. Anderson 及 J B. Moore 著 , 线 性 最 优 控制 )。 
对 于 五 "控制 (定理 7-7 中 所 考虑 的 情形 ) ,定义 回 差 矩阵 
D(s)=I—K(sI—A)-'B, 
则 有 
D (一 jw)D(jw) 之 1 十 B3 (jw 一 47)-1PBBTP(ior 一 4)-:B， 


因 上 述 不 等 式 右 端 第 二 项 是 非 负 的 , 故 知 五 ”控制 系统 的 稳定 裕 量 大 于 LQ 控制 系统 。 


7.4.4 输出 反馈 H” 控 制 


仍 考 虚 式 (7-96) 所 描述 的 (三叉) 被 控 对 和 象 
T=AXx+ Bw-+B,u 
ortowt om 
?一 人 ;十 了 YY 
要 求 设 计 一 控制 顺 
u= Ky 
使 得 闭环 系统 满足 如 下 条 件 ( 条 件 OF) 
7%(s) | -<>, 且 闭环 系统 内 稳 
假设 (广义 ) 被 控 对 象 满足 如 下 条 件 : 
CD [4,B1 |] 能 控 ,[C 4] 能 检测 。 
四 [4,8B,j] 能 控 ,[C;,4] 能 检测 。 
@ D,,=0,D,,=0., 
由 DislC! Di,=[0 1], 


sl， 了 =- 


定义 两 个 Hamilton 矩阵 


(7-105) 


A 7-2B,8T—B,BT 
H..= 


—CiC, 一 入 
] 一 | A! /2C1C 一 CIC， | 
~ LB,BT 一 


定理 7-8 使 闭环 系统 稳定 , 且 满 足 7 -< 的 输出 反馈 控制 器 存在 的 充 要 条 
件 , 是 如 下 三 个 条 件 成 立 ， 

( H.. Edom (Ric) ,X=Ric(H,)>0, 

@ J Edom(Ric),Y,—=Ric(J.,)>0, 

图 Ma (Fe YY, 

当 上 述 条 件 成 立时 ,五 "次 优 控制 器 如 下 


一 [4 ,一 ZL 天 ,0] (7-106 ) 
式 中 
4 一 4 十 :再 ,BT 天 十 民居 十 Z_Z_C， 
K,—— BIXY.. 
1 ycr (7-107) 
Z,— (1—7Y ?YX.)-! 
上 述 忆 可 以 表示 为 
r=At+ Bu ZL (Coty) + Bw (7-108) 


u—=Kox (7-109) 
e 2200 。 


Wworst =—=7 “BIX,x (7-110) 
系统 结构 图 如 图 7-13 所 示 。 显然 ,这 是 典型 的 观测 器 (7-108) 加 状态 反馈 (7-109) 结 构 ,只 
是 在 观测 器 方程 (7-108) 中 多 了 一 项 补偿 项 Biwworst。 实 际 上 ,Wwor 是 比值 Ze,/ wl; 
最 大 (扰动 抑制 效果 最 差 ) 时 ,扰动 输入 的 一 个 估 值 。 因 此 ,也 有 人 指出 ~ 最 优 控制 实际 
上 是 一 种 前 馈 补 偿 控 制 。 


图 7-13 输出 反馈 五 ~ 次 优 控制 系统 


利用 上 述 结果 来 设计 输出 反馈 五 "控制 器 的 步骤 如 下 ; 

QD 对 不 同 的 ”检查 定理 7-8 的 条 件 @@ 一 图 是 否 成 立 。 若 不 成 立 , 则 增加 y; 若 成 立 , 则 
减 小 ”, 直 到 7 的 迭代 变化 量 充 分 小 为 止 。 然 后 , 求 出 对 应 于 所 求 得 7 的 控制 器 。 

局 在 每 次 迭代 中 , 仅 需 解 两 个 与 (广义 ) 被 控 对 象 同 阶 的 Riccati 方程 。 

(3) 所 求 得 控制 器 的 阶 次 与 (广义 ) 被 控 对 象 的 阶 次 相等 。 


7.4.5 输出 反馈 H” 控 制 与 LQG 控制 的 比较 


我 们 先 介绍 LQG 或 说 H? 控制 的 有 关 结 果 , 然 后 将 五 "控制 与 LQG 控制 加 以 比较 ， 
以 显示 它们 之 间 的 关系 。 

考虑 系统 (7-96) ,并 假设 式 (7-105) 的 条 件 成 立 。 在 玉 : 控制 器 的 设计 中 ,是 要 求 得 到 
一 个 ,使 得 当 

u—kKy 

时 ,下 述 条 件 ( 最 优 条 件 OF,) 成 立 : 

| 7:。(s) | 一 >, 且 闭 环 系统 内 稳 。 
或 者 (次 优 条 件 OF ) 

| TCs) ,之 7, 旦 闭环 系统 内 稳 。 

定义 Hamilton 矩阵 


”2600。 


CIC, 一 由 
A! —C,C, 
= ” ， | 
— BB 一 种 


则 由 引 理 7-12 知 :如 :Edom(Ric) ,JEdom(Ric), 且 
X,=Ric(H,) 之 0, 7 一 Ric(y2 ) 0 


定义 

A+B,.K, :1 

G. (5)=| .- | 
C.D,AK,:0 

G(s) = | 

i 0 
K,= — B2X, 
L,— —Y,C; 


定理 7-9 使 最 优 条 件 OF 成 立 的 控制 器 为 
_ 让 : | 
Ko = | -… 


式 中 
A,=A+B,K;,+tL,C, 
而 
min | Ts) || 3= || GC8)B | 2+ | KR;GCs) | 
当 贡 之 pz,pP 宇 mz 时 ,上 述 最 优 控制 器 是 唯一 的 。 
对 于 玖 ”次 优 控制 郑 , 有 如 下 结果 。 
定理 7-10 使 次 优 条 件 OF; 成 立 的 控制 器 集 
合 , 是 图 7-14 中 yy 到 ww 的 传递 矩阵 的 集合 。 图 中 
二 . | 
-CT 0 
而 QERH’, COlI<2X 一 (| GB | ?+ | KG | 2) 
周知 ,HH 控制 占有 如 下 分 离 特 性 : 图 7-14 ”次 优 控制 系统 


X=Ax+BoutL, (Ci— y) 


M.,(s)= 


u=—=K,x 
式 中 x 为 控制 器 的 状态 ,Li 为 Kalman 观测 器 增益 矩阵 ,而 K; 为 最 优 状 态 反 馈 阵 , 它 们 可 
以 分 别 独立 于 Ts(s) 上 ‖; 的 最 小 化 和 状态 的 估计 进行 设计 。 
对 于 输出 反馈 五 "控制 器 ,我 们 有 
x—Ax+Bout Ze Lo (Cax—y) + Bwors 
u=Kx 
Wworst = —7 :BIX.x 


。 26] 。 


从 结构 上 来 看 ,输出 反馈 瓦 " 控 制 器 也 具有 分 离 特性 。 比 较 定 理 7-9 和 定理 7-7 的 结 
果 可 知 , 这 里 的 太 ” 状 态 反 馈 阵 KK., 也 可 以 独立 于 状态 估计 而 设计 ,而 ZL 是 在 输入 w 
为 最 坏 的 情况 下 观测 器 的 增益 阵 。 但 在 态 ” 控 制 器 中 ,多 出 一 项 wworst, 它 是 最 坏 情 况 下 的 
(使 上 zj 最 大 的 ) 输 入 ww 一 一 BIXx 的 估 值 。 

当 令 7 一 co 时 ,HH 一 HH?,J。 一 J;Zo 一 1;ZoL 一 LL; 一 Ky;Wworn 一 0。 即 H”“ 控 制 器 
一 HH? 控制 器 。 因 此 ,HH? 控制 是 如 ”控制 的 一 个 特例 。 


习 题 
7-1 已 知 传递 函数 
一 ] 
G(s)= 二 
的 最 小 实现 为 
G(s)=[A,B,C,D | 
式 中 


4=| | 8=| "|， C=[—1,1], DpD=0 


试 将 G(s) 互 质 分 解 为 
G(s)=N(CGOM (Gs) = MCNG) 

7-2” 试 说 明 如 何 将 跟踪 问题 . 鲁 棒 稳定 性 问题 和 模型 匹配 问题 化 为 标准 及 ”控制 
问题 。 

7-3 试 证 明 BIBO 稳定 的 充 要 条 件 是 系统 的 脉冲 响应 (2) 绝 对 可 积 ，。 

7-4 ” 试 证 明 夺 系统 是 内 部 稳定 的 , 则 必 是 BIBO 稳定 的 ;但 道 问 题 则 不 一 定 成 立 ， 

7-5 在 标准 态 ” 控 制 问题 中 ,K 使 G 稳定 的 充 要 条 件 是 什么 ? 试 证 明之 ， 

7-6 设 如 图 7-2 所 示 的 跟踪 问题 中 

3 一 1 3 十 1 
ra 2) (一 0 二 1 


P(s)= 


试 求 : 
(1) 三 义 被 控 装 置 G(s)。 
(2) 求 G(s) 的 一 个 最 小 实现 ,G(s)= 二 [4,B,C,D], 
(3) 按 互 质 分 解 求 使 G(s) 稳 定 的 K。 
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第 8 章 奇异 最 优 控制 


第 3 章 在 前 述 时 间 最 优 控制 问题 时 , 曾 谈 及 奇异 情况 . 除 此 而 外 ,在 某 些 最 优化 问题 ， 
例如 ,邻近 极 值 控制 问题 中 ,也 会 出 现 3 五 /a wu 二 0, 且 9:H/9 wi 为 青 异 矩阵 的 极 值 弧 线 ， 
这 种 极 值 弧 线 称 为 奇异 弧 。 在 奇异 弧 上 ,最 优 控 制 可 以 存在 ,也 满足 极 小 值 原理 ,但 由 极 小 
值 原理 解 不 出 最 优 控 制 w* (1) 的 具体 形式 。u* (t) 可 以 在 控制 边界 之 内 取 值 ,并 需 用 附加 
检验 来 确定 奇异 弧 是 否 最 优 。 

在 本 章 讨 论 的 奇异 最 优 控 制 的 问题 中 ， 我 们 将 限于 讨论 哈密 顿 函 数 如 对 控制 变量 4 
为 线性 关系 ,而 对 状态 变量 x 为 非 线 性 关系 的 情况 ,因为 这 种 情况 是 实际 应 用 中 遇 到 奇异 
弧 的 最 弟 见 情况 。 线 性 、 二 次 型 状态 最 优 调节 器 问题 中 ,也 存在 类 似 的 奇异 解 。 

求解 奇异 最 优 控制 比 求解 正常 最 优 控制 要 困难 得 多 。 奇 异 解 通常 由 正常 弧 和 奇异 弧 
所 组 成 。 为 了 判断 和 确定 奇异 统 的 最 优 性 ,可 以 采用 广义 凸 性 条 件 和 雅 各 布 森 条 件 , 这 是 
两 种 确定 奇异 弧 的 必要 条 件 。 有 关 正 常 弧 与 奇异 弧 的 连接 条 件 问 题 ,也 有 一 些 研 究 成 果 。 
然而 ,奇异 最 优 控制 理论 和 方法 的 研究 , 尚 不 成 熟 , 有 待 进 一 步 发 展 和 完善 .本 章 将 简要 介 
绍 线性 系统 和 非 线性 系统 奇异 解 的 确定 方法 及 其 应 用 ,并 对 奇异 最 优 调节 器 问题 进行 单 
独 论 述 。 


8. 1 最 优 控 制 问 题 的 奇异 解 


本 市 将 从 一 一 个 特例 给 出 奇异 最 优 控制 中 的 基本 概念 ,并 不 加 证 明 地 给 出 检验 和 确定 
奇异 弧 最 优 性 的 必要 条 件 。 


8.1.1 特例 


设 一 阶 系统 方程 及 初始 条 件 为 
z(t)=u(t), CO) 一 ] 


控制 为 jz(b| 委 1, 要 求 最 优 控制 x” (4) ,使 性 能 指标 
J= 3| x cid: 


为 极 小 。 设 未 态 要 求 (2) 二 0。 
首先 构造 哈密 顿 函数 


H=57 (+A ue) 


式 中 4 为 拉 格 朗 日 乘 子 。 根 据 极 小 值 原理 ,对 于 非 零 的 4(z) ,最 优 控制 为 

一 一 加 十 1， A(t) 二 0 

U (t)=—sgn{4())} _] No (8-1) 
式 (8-1) 表 明 , 最 优 控 制 在 其 约束 边界 上 取 值 ,为 邦 - 邦 控制 形式 ， 其 相应 的 轨 线 称 为 正常 
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弧 。 男 一 方面 ,由 于 哈密 顿 肾 数 五 线性 依赖 于 控制 变量 x(i) , 当 协 态 变量 4(2) 二 0 时 , 必 
出 现 奇异 控制 情况 ,此 时 相应 的 轨 线 称 为 奇异 弧 。 
根据 极 小 值 原理 , 当 控 制 变 量 x( 刀 在 约束 边界 士 1 之 内 取 值 时 ,有 
A4)=0, 9 一 
因 为 式 (8-2) 满 足 极 小 值 原理 的 必要 条 件 , 所 以 4(G) 一 0 也 是 产生 最 优 控制 wx” G4) 的 一 个 
可 能 解 。 此 时 , 消 数 矿 与 控制 w(i) 全 然 无 关 , 因 而 哈密 顿 函数 互 无 法 相对 w(t) 取 绝对 极 
小 。 换 名 话说 ,与 4()= 二 0 相应 的 控制 ,虽然 满足 极 小 值 原理 ,但 却 无 法 应 用 极 小 值 原理 的 
方法 求 出 与 4(z) 二 0 相应 的 奇异 最 优 解 a* (1)。 这 种 控制 问题 称 为 奇异 最 优 控 制 问题 。 
为 了 确定 奇异 解 , 设 4(G0) 盖 0, 则 “ (2) 二 一 1。 积 分 下 列 正则 方程 ; 
Z(t)=u(t)=—1 


0 (8-2) 


i) = 一 一 一 z(t) 
.机 


并 代入 已 知 初 态 z(0)==1, 可 得 


X(t)=1—t 
A =AC0) —t+ 5 


在 奇异 弧 上 必 有 

: 9H _ 
Qu 
d /a8 
di au 
d: [9 
di du 


A(t)=0 


~A()=—z(t)=0 | (8-3) 


一 一 Z(t) 二 一 w(t) 二 0 


解 式 (8-3) 诸 式 ,得 奇异 解 
u(t)=0, At 一 0， z(t)=0 
设 一方 时 ,最 优 轨 线 由 正常 弧 进 入 奇异 狐 , 则 有 


Alt) 一 M0) 一 二 十 广 好 一 0 
解 得 
_ 一 工 
上 一 ]， A 作 O) 一 9 


说 明 44)>0 的 假设 是 正确 的 。 若 设 4(t) 过 0, 会 得 到 二 = 一 1 的 不 当 结论 。 但 是 , 若 初 态 
z40)<0, 则 情况 正好 相反 。 本 例 的 求解 结果 如 图 8-1 所 示 。 
对 于 所 有 的 4 上 EL1,2], 由 于 
zt) 一 CC(2) 一 0 


A =A(2)=401) 一 ty 十 六 地 =0 


u(t)=zi(t)=0 
表明 奇异 解 满足 末 值 条 件 , 故 i:€ [1,2] 为 奇异 段 ,或 称奇 异 时 间 间 隔 。 最 优 轨 线 由 正常 绝 
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图 8-1 特例 的 最 优 解 


及 奇异 弧 两 部 分 组 成 。 
8. 1.2 奇异 最 优 探 制 问 题 
问题 8-1 设 系 统 状态 方程 为 


T(t)= f(x u,t), x(to) = xo (8-4) 
式 中 x(t)E RW) ER" ,控制 约束: | zz 人) | 委 1, 7 一 1,2，… ;711 性 能 指标 为 
J=gx GD) 站] 十 | Lr) di (8-5) 


式 中 可 以 固定 ,也 可 以 自由 。 要 求 最 优 控制 u* (2) ,使 性 能 指标 (8-5) 极 小 。 
构造 哈密 顿 函数 
Hlxyu,A ,t)=L(x ,ut) A Gf x,u,) (8-6) 
式 中 4 (1)€ R", 为 待定 的 拉 格 朗 日 乘 子 向 量 。 根 据 极 小 值 原理 , 当 控 制 变量 在 约束 边界 之 
内 取 值 时 ,哈密 顿 画 数 五 相对 最 优 控 制 取 极 小 值 的 必要 条 件 为 
aH 


5 一 0 (8-7 ) 
3 万 
gm 之 0 (8-8) 


条 件 (8-8) 称 为 凸 性 条 件 ,或 称 勤 让 德 - 克 莱 勃 希 条 件 。 
哈密 顿 函 数 互 相对 最 优 控制 取 极 小 值 的 充分 条 件 是 
| aH 
“= 
aH 
au 


条 件 (8-9) 称 为 强化 条 件 ,或 称 强化 的 勒 让 德 - 克 莱 勃 希 条 件 。 
如 果 在 某 一 时 间 间 隔 [4,ts]C[to,ty] 上 ,矩阵 全 信 奇异 , 即 


0 


>0 (8-9) 
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det| 入) 一 0 (8-10) 
局 
或 者 矩阵 信和 非 负 定 , 妈 
2 HH (8-11) 
du 


则 称 问题 8-1 是 奇异 的 。 此 时 的 最 优 控 制 为 奇异 最 优 控制 ,与 奇异 最 优 控 制 对 应 的 最 优 轨 
线 部 分 称 为 奇异 弧 , 在 奇异 弧 上 ,同性 条 件 成 立 , 但 强化 条 件 不 成 立 。 时 间 区 间 [zi ,ts 称 为 
奇异 时 间 间 隔 。 

实际 上 , 如 果 哈 密 顿 函数 是 控制 向 量 的 线性 函数 ,那么 根据 上 述 定义 , 问题 必 是 奇异 的 。 

在 奇异 弧 上 ,由 于 哈密 顿 隧 数 五 与 控制 向 量 w 无 关 , 因 此 根据 极 值 条 件 3 已 /av 一 1 
得 不 到 确定 的 最 优 控 制 。 如 果 在 区 间 [s ,tsJ 上 存在 奇异 最 优 控制 , 必 存 在 3 五 /az 一 0 的 关 
系 ,进而 必须 满足 9 五 /9& 对 时 间 各 阶 导 数 为 零 的 下 列 附 加 条 件 ; 

a 


5 一 0 (8-12) 
d /aH 
il ga 0 z (8-13) 
d /aH 
| ge 二 0 (8-14) 


联 立 求解 上 述 三 组 代数 方程 ,可 以 求 出 奇异 最 优 控 制 u* (4)、 奇 异 弧 x* (2) 以 及 相应 的 协 
态 A (4)。 


应 当 指 出 ,利用 式 (8-12) 一 式 (8-14) 求 出 的 奇异 解 是 否 最 优 , 需 要 进行 附加 检验 。 
8. 1.3 奇异 弧 最 优 性 的 必要 条 件 


在 奇异 弦 上 , 极 小 值 原理 没有 为 确定 奇异 控制 提供 任何 信息 ,为 了 弥补 奇异 情况 下 定 
解 条 件 的 不 足 , 需 要 男 外 寻找 奇异 弧 应 满足 的 其 他 条 件 有 人 从 泛 函 二 次 变 分 非 负 性 条 件 
出 发 ,村 出 了 奇异 弧 最 优 性 的 两 种 新 的 必要 条 件 : 广 义 凸 性 条 件 , 或 称 广义 勒 让 德 - 克 莱 孝 
希 条 件 , 以 及 雅 各 布 森 条 件 。 

根据 第 2 章 介 绍 的 变 分 理论 可 知 , 对 于 问题 8-1, 若 令 J 为 广义 泛 函 , 则 沿 最 优 轨 线 
应 有 :6J, 一 0,6*J, 之 0。 奇异 弧 满 足 6J。 二 0 条件 ,但 仅 此 不 足以 给 出 奇异 最 优 控制 。 不 难 
于 出 ,问题 8-1 的 广义 泛 函 二 次 变 分 为 


9 2H a°H 
1 lr r/o 9 了 TT xx 9 xau 网 

0°J,= 2 LOx GD 本 750xCtD) j= 2 ,Lox Gu | jar T arr [Ls, dz (8-15) 

[| adu’ 

式 中 变 分 6x 和 6u 应 满足 
,9 gd 

x= 人 6x 十 了 全 6u (8-16) 
Gx(to)=0 (8-17) 


从 二 次 变 分 (8-15) 在 约束 (8-16) 和 (8-17) 下 的 非 负 性 出 发 ,可 以 导出 如 下 新 的 必要 
条 件 。 
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定理 8-1 对 于 问题 8-1 ,标量 控制 (i) 为 最 优 的 一 个 必要 条 件 为 
,9 di*”/9H _ 


du 
上 述 必 要 条 件 (8-18) 在 形式 上 类 似 于 上 同性 条 件 (8-8), 阁 称 为 广义 同性 条 件 ,或 称 广义 勒 
让 德 - 克 莱 勃 希 条 件 。 对 于 定理 8-1, 应 指出 如 下 数 点 ， 
(D 式 (8-18) 中 2& 人 恒 为 偶数 ,其 中 整数 & 称 为 该 奇异 问题 的 阶 数 。 
加 在 x 一 4 空间 中 ,奇异 曲面 的 维 数 为 2(n 一 k) ,有 关 奇 异 曲 面 的 概念 将 在 下 节 介 绍 。 
3) 关于 xb 为 向量 时 的 广义 勒 让 德 - 克 莱 勃 希 条 件 ,可 参阅 文献 [Bell et al. ,1975]。 
可 异 弧 最 优 性 的 男 一 个 必要 条 件 是 雅 各 布 森 条 件 , 见 如 下 定理 。 
定理 8-2 对 于 奇异 最 优 控 制 问 题 8-1, 若 末端 自由 , 则 二 次 变 分 (8-15) 非 负 的 必要 


条 件 是 
CB+B WB>0, V iELto,t) (8-19) 
矩阵 WW 满足 
—W=Q+AW+WA, + WG) -0 (8-20) 
式 中 
_9H 9 
QOx? Oudr 
af af (8-21) 
gx 2 


应 当 指出 ,广义 勒 让 德 - 克 莱 勃 希 条 件 与 雅 各 布 森 条 件 是 两 个 不 同 的 必要 条 件 。 满 足 
前 者 并 不 一 定 满足 后 者 ,一般 地 说 ,奇异 弧 同 时 满足 这 两 个 必要 条 件 也 未 必 是 最 优 的 。 到 
目前 为 止 ,尚未 得 到 奇异 最 优 控制 的 充分 条 件 。 对 于 简单 的 问题 ,可 以 通过 问题 的 物理 意 
义 ,或 者 通过 直接 计算 性 能 指标 的 方法 ,来 判断 利用 奇异 性 必要 条 件 求 出 的 奇异 最 优 控 制 
是 否 合 乎 问题 的 要 求 。 
例 8-1 已 知 系统 方程 
ab 一 Zoot)， Xx1(0)=0 
T(t)=u(t), Zoo(0) 一 ] 
性 能 指标 


1 3x/2 
7= 地 | [— zx?) 4 x) dz 


试 求 使 性 能 指标 极 小 的 奇异 解 。 
解 ” 构 造 哈密 顿 隆 数 


H=3 (一 zf+z) 十 Nz 二 


由 于 矿 相对 w 为 线性 关系 , 故 存在 奇异 解 。 
协 态 方程 及 横 截 条 件 为 


ht) 一 并 (Ci)， A > 一 0 


A 


则 由 式 (8-12) 一 式 (8-14) 解 得 
ht 一 0， To 一 一 At lt)= ~— ri(t) 


将 zx 一 一 CGI 代 人 状态 方程 ,得 


0 1 
2 一 | jx) 
一 上 0 
其 状态 转移 阵 为 
站 We | 
e”’ = i 
一 Sin cost 
于 是 
sint 
x() =erx(0)=| | 
COSL 
奇异 解 为 
2 (1 一 一 Sint， Zi'(t)~sint, xr? (ti 一 cost 
hi (1) = —cosi, A, (1)=0 
奇异 解 对 应 的 性 能 指标 


1 3x/2 
J -| (—sin’t+cos’t)dt 
0 . 


= 元 | “cos24dt=0 
为 了 检验 奇异 弧 的 最 优 性 ,由 式 (8-21) 算 得 


9H 
C 一 5 和 5 一 L0 0 
9 
ou 0 
du af, ] 
ou 
9f, 9 
x af: 3 大 | -0 0 
dx! dx, 
da‘H ao“H 
oa’H 9 Xi 9 X19 7X, I | 
ax’ a2H 9H 0 1 
9 X29 XI 9 x 


车 令 
W = Mg | w| "| -| 


(C+B'W)B=W>0 
骨 由 式 (8-20) 得 如 下 微分 方程 组 ，; 


一 太一 一 1， Wu | 2"| 二 0 


则 由 式 (8-19) 可 得 
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. 3 
— Wz= Wn, Wal Bi 二 0 


, 3 
—Wa=Wau, Woe 二 0 


pa 


一 全 2 一 1] 二 Wiz 十 Wz1， Wal Bd 一 0 


不 难 解 得 
WCGD 一 一 六 x 十 : 
9 .3% 了 ,2 
Wi,(t) = 8 十 7 ™t 2 
9 3 1, 
W ,1 (#) = 8 ont 7 
9 3 9 3 ] 
Waz(D)=— sl oN 
若 令 
tt 
则 有 


W(tT)=t— 3 


显然 ,rz> V3 时 ,或 者 :< 了 x 一 V3 时 , 雅 各 布 森 条 件 (8-19) 不 再 满足 。 因 此 , 当 r>> V3 
时 ,奇异 弧 不 是 最 优 的 。 


8.2 线性 系统 的 奇异 最 优 控 制 


本 节 讨 论 线性 二 次 型 问题 的 奇异 解 , 并 介绍 一 种 新 的 确定 奇异 最 优 控 制 的 简便 方法 。 
8. 2.1 线性 育 漠 最 优 探 制 问题 
问题 8-2” 设 线性 时 变 系 统 方程 


T(t)—=ACIXCE)TBOu), x(to)=xo (8-22) 
式 中 xQ)ER', 和 矩阵 4(t) 和 BG) 维 数 适当 ,其 各 元 连续 有 界 。 控 制约 束 为 
uC0) ll, ;=1,2,…,m (8-23) 


性 能 指标 为 状态 的 二 次 型 
J 一 Dx GDFxGD t+) x Qa (8_24) 


式 中 加 权 和 矩阵 F 和 8G) 都 是 对 称 非 负 定 矩阵 , 维 数 适 当 , 且 0() 各 元 连续 有 界 ,要 求 满足 
约束 条 件 (8-23) 的 最 优 控 制 w" (2) ,使 性 能 指标 (8-24) 极 小 。 

上 述 问 题 与 标准 状态 调节 器 的 差别 在 于 :前 者 对 控制 的 限制 由 不 等 式 约束 (8-23) 直 
接 给 出 ,而 后 者 对 控制 的 限制 由 性 能 指标 中 的 惩罚 项 & (2)RG)wuC) 体 现 。 从 工程 观点 来 
看 ,问题 8-2 的 提 法 更 符合 实际 。 
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8.2.2 ” 育 异 解 
对 于 问题 8-2 ,构造 哈密 顿 郴 数 
H=3x" (QOx0) HA AD EH HA Bw) z (8-25) 


由 于 哈密 顿 清 数 妃 是 &G) 的 线性 图 数 , 放 有 产生 奇异 解 的 可 能 。 根 据 极 小 值 原理 
正则 方程 


#1) = = Ar) +B ue) (8-26) 
1)=— SQ xr) +ATDA CD (8_27) 

横 截 条 件 及 边界 条 件 
Y(to) 一 Ko (8-28 ) 
Atr) 一 FFxCtr) (8-29) 

极 小 值 条 件 
H* a (8-30) 
因而 

u’ (1)—=—sgn{B' GQ)A GG)) (8-31) 


若 B (CA CD 天 0,VYiE [to,tyj, 则 使 哈密 顿 函数 五 为 极 小 的 u(t) 出 现在 约束 边界 


上 ,最 优 控制 为 邦 - 邦 控制 ;形成 正常 骤 ; 知 存 在 [i ,tz CLto ,tj ,使 得 
z aH 


pT 
Ep ~B (G4)AG)=0 (8-32) 
a°H 

可 二 —0 (8-33) 


则 问题 8-2 存在 奇异 解 。 奇 异 弧 除 满足 式 (8-32) 外 ,还 满足 


$F {S| = ELBA I=B DA) + BT DAO) 
—[x COG0+AGAG) IBOO+AXABCG)=0 (8-34) 
以 及 : 
dz 1 3 万 人 Ta , \ 
Ti 本 | 一 一 LEx (QTx OG) HAA A AAG) BC) 


/ 十 Lz QO) AA A BO +ANBG)=0 (8-35) 
将 正则 方程 (8-26) 和 (8-27) 代 和 人 式 (8-35) ,经 整理 得 
B (Q(BOu (CD 一 [BTCGD4TCGDOOCD 一 BTCGDIOCGD4CGD) 一 BTCGDIOCD]xCt) 
十 [BTCGD)A4T (2)— BTG)ATGE) +BT CG) JA CD (8-36) 
如 果 和 矩阵 BG) 列 满 秩 , 即 
rank {B()}=m (8-37) 
有 目 mrxxm 和 矩阵 B'()QC()BG) 非 奇异 , 则 奇异 最 优 控制 
xz (2)=—[B' (GQ)BG) BG {OU AG) — ATOHOG) HOG) x0) 
一 [L47 (2)—ATOQ)D +LBT OO BE) TB NA 0) (8-38) 
联 立 求解 矩阵 方程 组 (8-38)、(8-26) 和 (8-27) ,并 考虑 边界 条 件 (8-28) 和 (8-29) ,可 以 得 到 
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问题 8-2 的 奇异 解 。 

如 果 问 题 8-2 为 定常 问题 , 则 因 4、B8、8 均 为 常数 矩阵 ,因而 在 满足 条 件 (8-37) 的 情 

况 下 , 哥 异 最 优 控 制 表 达 式 为 

z ({)=—(B' 0B) 'B'[ (OA—A'O)x()—ATATACG)] (8-39) 
式 《(8-39) 表 明 , 帮 问题 8-2 在 定常 情况 下 存在 奇异 解 , 则 奇异 控制 是 状态 x(t) 和 协 态 4 (2) 
的 线性 肾 数 。 

以 上 求 得 的 奇异 最 优 控 制 w* (1) 表 达 式 (8-38) 或 (8-39), 适 用 于 复合 型 性 能 指标 、ty 
固定 .未 态 自 由 .B GQ)Q()BG) 非 奇异 的 情况 。 但 是 ,对 于 积分 型 性 能 指标 .tj 自由 .未 态 
受 约束 或 固定 等 情况 ,只 要 改变 相应 的 边界 条 件 和 横 截 条 件 , 式 (8-38) 或 式 (8-39) 的 形式 
并 不 改变 ,因此 具有 一 般 性 。 : 


8. 2.3 奇异 超 曲 面 


当 问 题 8-2 定 芝 .自由 、 末 态 自由 时 , 沿 最 优 轨 线 
l 


五” 一 CDOGxr() 十 ACEDL4XCD) 十 Be (1) |=0 (8-40) 
在 奇异 弧 上 ,满足 
BTAC)=0 (8-41) 
u 
d/oaH\Y_ jr T 
Fla)=—B [OxCG)+ATACG) |=0 (8-42) 


方程 组 (8-40)~(8-42) 代 表 了 关于 4 (2) 和 x(t) 的 2m 十 1 个 方程 ,定义 了 在 (x,X )2n 维 空 
同上 可 能 的 奇异 绝 轨 迹 , 而 方程 (8-39) 是 在 奇异 弧 上 得 到 的 线性 反馈 律 。 此 时 ,k= 二 1 时 的 
广义 凸 性 条 件 
- 纯 [ 芋 | 经 
DiLd -il ou 
在 8 之 0 条件 下 得 到 满足 。 因 此 , 式 (8-39) 是 奇异 最 优 控制 的 必要 条 件 。 
因为 奇异 统 上 的 各 点 (x ,4 ) 满 足 式 (8-40) 一 (8-42) 描 述 的 2m 十 1 个 方程 ,因此 最 优 
奇异 弧 知 存在 , 必 在 由 上 述 2m 十 1 个 方程 所 决定 的 超 曲面 上 , 令 
3 如 _，d132 鼠 
au “di! ou 
则 S 是 (x,4 )2n 维 空间 上 的 一 个 2(x 一 m) 维 超 曲面 。 以 S 超 曲面 上 的 各 点 作为 初始 条 
件 ,并 采用 控制 律 (8-39), 才 可 能 形成 奇异 弧 , 故 S 称 为 2(n 一 m) 维 奇异 超 曲 面 。 
需要 指出 ,奇异 解 可 能 是 最 优 解 ,也 可 能 不 是 ,并 且 目 前 尚 不 知道 充分 条 件 是 什么 . 因 
此 ,含有 奇异 控制 的 问题 格外 难 解 ,而 且 通 常 判断 奇异 弧 是 否 最 优 轨 线 的 一 部 分 也 很 麻 
烦 。 虽然 找到 了 一 个 广义 凸 性 条 件 和 雅 各 布 森 条 件 , 但 都 是 必要 条 件 , 对 求 可 能 解 并 没有 
太 大 的 帮助 。 奇 异 最 优 控制 的 研究 , 尚 有 待 进一步 完善 。 
例 8-2 已 知 二 次 积分 模型 : 


ZX] (1) = x,(t),， X1(0)= 7x,, Xi(ts)=0 


| = 一 让 (8'QBu)=B'0B>0 (8-43) 


s= {Ga) 


=0,H=3""Qr+AT (Axr+Bu) | (8-44) 


X(t)=u(t), Za 人 0) 一 Zoo， xslty)=0 
控制 约束 |xz(t| 委 1。 人 性 能 指标 


* 271。 


=| [at +a) dt 
式 中 tj 自由 。 试 求 最 优 控 制 u* (2)。 
解 ” 本 例 为 线性 定常 系统 、 积 分 型 性 能 指标 .ty 自由 .未 端 固定 的 最 优化 问题 .构造 哈 
密 顿 晤 数 
H=5 (1 +z) + hr hu 
根据 极 小 值 原理 可 知 , 相 应 于 正常 统 段 的 最 优 控 制 为 如 下 邦 - 邦 控制 形式 : 
u* (1)=—sgn{h, (1)} 


拖 - 邦 绝 段 满足 下 列 正则 方程 : 
Xi1(f) = x(t), tz,(t) = ~— sgnid,(t))} 
A(t)=—zt), ht)=— rt) —A 0) (8-45) 


在 相 平面 上 , 邦 - 邦 弧 的 切换 线 方程 为 


an -一 { (Xi » Ts) [zi — 2, rs<0) 


2 
7_={(z1z2) z= 一 方 寺 ,7 之 0) 
另 一 方面 ,图 数 五 线性 依赖 于 wx, 所 以 还 可 能 存在 奇异 孤 段 。 对 于 奇异 弧 段 ,下 式 成 立 : 
= =0 
[== zx) A) 0 (8-46) 
| 2 和 | 一 一 二 (一 和 DO= 一 xD 十 zi(D 一 0 


解 得 奇异 最 优 控制 
2 《iD 一 (ZL) (8-47) 
说 明 奇 异 最 优 控制 是 部 分 状态 变量 的 线性 反馈 。 上 述 结果 亦 可 由 式 (8-39) 解 出 。 
下 面 求 奇异 弧 方 程 。 将 奇异 控制 (8-47) 代 和 人 状态 方程 


Zz1(t) = z(t) 
z(t) = z(t) 
因为 
drilt) dx;,(t) 
Talt) IE) 
积分 可 得 奇异 绝 方 程 
Xi(t)— xi(t)=const (8-48) 
由 于 要 求 zi1(y) 二 z(ty) 二 0, 所 以 满足 末 值 条 件 的 奇异 弧 为 两 条 直线 ,其 方程 为 
Xl 十 区 ;二 0， 区 | 一 序 2 一 0 


奇异 弧 轨 线 如 图 8-2 所 示 ,图 中 箭头 表示 相 点 的 运动 方向 。 显 然 , 我 们 要 求 在 奇异 弧 上 系 

统 的 运动 是 稳定 的 , 改 应 取 如 下 奇异 弧 方 程 。 此 外 ,奇异 控制 亦 应 满足 控制 约束 条 件 

zj 三 1, 因此 要 求 | (tj 和 1。 于 是 ,满足 控制 约束 且 产 生 稳定 运动 的 奇异 弧 方 程 为 
X1 十 ZX, 二 0 
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在 奇异 弧 上 ,通过 对 奇异 控制 状态 方程 的 积分 ,可 得 相 点 运动 规律 为 
Ti) 一 Ce， X(t)=—ce (8-50) 


正好 满足 奇异 红 方 程 xz1 十 xz 一 0。 其 中 常数 c 由 奇异 弧 上 起 始点 的 坐标 决定 。 


六 | 
| 
| 
f Xi—xo=0 
Bi XI 
D 证 必 1 | 站 十 | 
D | 
| 
| 
一 | 4 一 | 
次 
A 
图 8-2 例 8-2 的 奇异 弧 图 8-3 原点 附近 开关 曲线 7 


接 者 ,我 们 研究 不 同 初 态 条 件 下 ,系统 最 优 轨 线 的 组 成 情况 。 


当 (zioyzzo) 在 原点 附近 。 即 |zioj 和 1、| zol 玉 1 时 ,可 以 算得 , 邦 - 奇 控制 比 邦 - 邦 控制 
的 性 能 指标 要 小 ,因此 奇异 弧 7, 就 是 原点 附近 邦 - 奇 控制 的 开关 曲线 ,如 图 8-3 所 示 。 

当 (zio,X20) 远 离 原 态 时 ,可 以 算出 ,进入 奇异 绝 以 前 的 邦 - 邦 弧 的 开关 曲线 十 分 接近 
邦 - 邦 控制 的 开关 曲线 ,各 种 邦 - 奇 控制 的 典型 最 优 轨 线 及 邦 - 奇 时 间 控 制 律 如 图 8-4 所 示 。 


例 8-3 设 二 阶 自治 线性 系统 
ZTCtE) 一 (tt 十 ML)， TX1(0)= Zz10, Xi(tr)=0 
Tz,(1) = —u(lt), T,(0) = Zz, Zaottr) 一 0 


性 能 指标 
JJ 一 3| 全 (1) dt 
式 中 心 给 定 。 控 制约 束 |x( | 三 MM。 试 求 最 优 控 制 wu* (2)，。 
解 ”构造 哈密 顿 图 数 


H= ztt h(t) — hu 


根据 极 小 值 原理 ,正则 方程 及 边界 条 件 为 


元 I ztu, XTX1(0)= x1 
和 一 5 一 —u，, Xx,(0) = Zz» 
= 一 zt, zt) =0 
有 一 一 5 二 一 一 加， Xs (tr)=0 
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可 


(a) 


邦 - 邦 控制 


奇异 控制 


(b) 


图 8-4 抑 - 奇 控制 律 及 其 轨 线 
奇异 弧 必 定 使 得 在 一 有 限时 间 区 间 中 ,有 
aH 


一 和 一 =0 

[2 = 一 罗 = 一 x 十 为 二 0 解 得 奇异 最 优 控制 
和 -于 一 一 丈 : 十 和 三 一 Z2 一 & 一 和 一 0 

u* (2)=—[z1(t) + z(t)] (8-51) 


式 (8-51) 表 明 , 闭 环 奇异 最 优 控制 是 状态 变量 的 线性 反馈 。 
由 于 哈密 顿 函 数 鼠 不 显 含 二 故 瓦 沿 最 优 轨 线 保持 为 遂 数 。 在 奇异 强 上 


H: 一 方 好 十 (za 十 四 一 2 


— Lt (rtu)— zu 


2 
一 六 好 十 zizs 一 const 
可 见 , 奇 异 弧 方 程 为 


广 好 十 zizz 一 const (8-52) 
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在 相 平 面 上 ,上 述 奇异 弧 方 程 代表 一 双 曲 线 族 , 如 图 8-5 所 示 。 


HH= 常 值 <0 
( 奇 窜 弧 ) 


图 8-5 其 有 奇异 强 的 最 优 轨 线 
图 8-5 中 , 双 曲 奇异 统 有 两 条 渐 近 线 , 即 


Ti 二 0， Xi 十 2Xxs 二 0 (8-53) 
因为 
oard*/aH 
-1>0 


故 广义 凸 性 条 件 成 立 。 下 面 分 两 种 情况 讨论 最 优 轨 线 问题 。 
(1) 当 MM 一 co 时 
当 Moo 时 ,表示 控制 wu(z) 无 约束 。 此 时 ,利用 脉冲 输入 瞬时 地 将 系统 状态 转移 到 奇 
异 绝 ,然后 沿 奇 异 绝 运 动 至 zi 十 x 二 0 的 直线 上 ,再 用 男 一 脉冲 输入 将 系统 状态 转移 到 原 
已 ,形成 冲 - 奇 - 冲 控 制 。 最 优 轨 线 已 画 在 图 8-5 之 中 。 
在 奇异 弧 上 , 式 (8-51) 成 立 ,将 其 代 人 系统 状态 方程 ,可 以 解 出 
2 一 ZICO0”)e 一 
X(t) = 07 )sinht x, 01 )e (8-54) 


式 中 sinht 一 地 (e' 一 e-) 为 双 曲 正弦 函数 。 不 难 验证 ,下 式 : 


成 立 。 利 用 倒 推 法 可 以 求 得 


2c 
1—e < 


Xi1(017)= 
x2(0" )= EPZ (8-55) 
式 中 < 一 zi(0) 十 zzC0)。 由 于 一 (0 ) 和 zsC07) 位 于 奇异 弧 上 , 必 满 足 奇异 弧 方程 (8-52)， 
故 有 


方 好 (0+) 十 zi(0+)za(0+) 一 a 一 const (8-56) 
将 式 (8-55) 代 入 上 式 , 计 及 双 曲 正切 
Ly 
tanhtr= a 


2750。 


— or 
2 0 (8-57) 


1 (1—e 2®”) 
当 zx1(0)、zxa(0) 和 已 知 时 ,根据 上 述 结果 ,从 所 有 可 能 的 双 曲 奇异 弧 中 , 选 出 要 求 
的 奇异 弧 ,使 系统 沿 此 奇异 弧 在 tj 时刻 到 达 zl 十 zx; 二 0 直线 ,从 而 最 后 在 脉冲 作用 下 趋 于 
(2) 当 M 有 界 而 女 目 由 时 
在 奇异 弧 渐 近 线 zi 一 0 上 ,奇异 最 优 控制 为 
u(t)=— (Xl 十 xX;) 二 一 Ys 
而 在 奇异 弧 男 一 条 渐 近 线 x 十 2xs 一 0 上 ,奇异 最 优 控 制 为 
u(t)=— (Xi 二 zx;) = 
由 于 jz 和 AM, 因此 ,奇异 踊 段 z= 二 0 的 范围 5S. 是 有 限 的 ,其 上 的 轨 线 方程 为 
ZX1(t)=0 
X2(t)= rt er (8-58) 
间 理 ,奇异 弧 段 xz! 十 2z;= 二 0 的 范围 S$, 也 是 有 限 的 ,其 上 的 轨 线 方程 为 
Ti (ti 一 2 人) 十 [1 一 e zx, (#1) 
2a(t) 一 e “r,t1) (8-59) 
式 中 广 是 奇异 弧 起 始 时 刻 。 最 优 轨 线 如 图 8-6 所 示 。 


2 


乔 
0 “~ 十 | MY 
2 
fa 
Pe B 
2 BD” 
i 
nt 
® A MX» 
一 | 人 $@ xr,+2x,=0 
eC 
图 8-6 最 优 轨 线 


将 S11 和 S: 上 的 奇异 控制 表达 式 代 和 系统 状态 方程 ,容易 判断 沿 Si 的 运动 远离 原 
尽 ; 而 沿 Sz 的 运动 指向 原点 。 由 于 要 求 的 末 态 为 原点 ,因此 5S, 为 要 求 的 奇异 弧 。 最 优 轨 线 
由 邦 - 邦 弧 和 奇异 弧 S, 组 成 。 例如, 当 MM=1,zx100) 二 0,z2(0)= 二 一 0.5 时 ,在 图 8-6 中 以 4 
所 表 示 ,最 优 轨 线 的 第 一 段 是 = 一 1 的 邦 - 邦 控制 正常 弧 , 交 5, 于 B 点 ,其 坐标 为 zi(zi) 
王 一 1，,zz(G) 一 0.5。 然 后 转 为 奇异 控制 一 zz, 相 点 沿 ;到达 原 点 。 相 应 的 最 优 轨 线 为 
4BO。 

右 初 态 远 离 原点 ,如 图 8-6 中 的 C 点 , 则 最 优 轨 线 的 前 两 段 分 别 是 w= 一 1 和 zx= 十 ] 
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产生 的 邦 - 邦 弧 CD 和 DF ,然后 沿 奇 异 弧 S; 到 达 原 点 。 相 应 的 最 优 轨 线 为 CDFO, 虽然 来 
用 两 段 邦 - 邦 控制 也 能 到 达 坐 标 原点 ,其 相应 轨 线 为 CEO, 但 其 性 能 指标 大 于 邦 - 奇 控制 的 
性 能 指标 , 故 CEO 不 是 最 优 轨 线 。 应 当 指 出 ,采用 最 优 的 邦 - 奇 控 制 , 末 态 时 间 zj 是 无 限 
的 ;而 采用 非 最 优 的 邦 - 邦 控制 ,所 和 需 的 末 态 时 间 zj 是 有 限 的 。 


8. 2.4 确定 奇异 解 的 控制 变量 转移 法 


奇异 最 优 控制 问题 的 求解 ,是 一 项 比较 困难 的 工作 。 到 目前 为 止 , 研 究 奇异 线性 二 次 
型 问题 的 方法 主要 有 三 种 :一 种 是 变换 的 方法 ,用 一 个 非 奇异 线性 二 次 型 问题 去 代替 奇异 
线性 二 次 型 控制 问题 ; 另 一 种 是 寻求 奇异 线性 二 次 型 问题 可 解 性 的 必要 条 件 或 充分 条 件 ， 
就 目前 来 说 ,附加 的 必要 条 件 已 有 人 提出 ,但 充分 条 件 尚 未 解决 ;再 一 种 是 利用 摄 动 方法 
把 奇异 问题 化 为 非 奇 异 问题 。 事 实 上 ,由 于 奇异 最 优 控 制 问题 的 复杂 性 ,每 一 种 求解 方法 
都 有 一 定 的 适用 范围 ,一 般 而 言 , 当 哈 密 顿 函数 石 线性 依赖 于 控制 ua() 时 ,就 可 能 出 现 奇 
异 控制 .如 果 利 用 正 交 变 换 将 系统 原 控制 向 量 置 于 重新 构造 的 哈密 顿 函数 之 外 ,选择 状态 
变量 的 一 部 分 作为 新 的 控制 向 量 ,县 该 新 的 控制 向 量 既 与 原 控 制 向 量 有 关 , 又 与 妃 函数 
不 呈 线 性 关系 , 则 可 以 应 用 求解 非 奇 异 控制 的 极 小 值 原理 求 出 奇异 解 ,这 就 是 控制 变量 转 
移 法 的 基本 思想 。 

考虑 如 下 常见 的 奇异 控制 问题 。 

问题 8-3” 设 线性 定常 系统 方程 


X(t) = Ax(t) + Buli) (8-60) 
性 能 指标 
J=| xzrCDOrCod (8-61) 
已 知 
rank$B=—r<mnn (8-62) 


其 余 假设 条 件 同 问题 8-2。 要 求 使 性 能 指标 (8-61) 为 极 小 的 最 优 控制 na* (4) 和 最 优 轨 线 
x (1t), 
按照 极 小 值 原理 ,构造 哈密 顿 函数 
H=x OQx++A' (Ax Bu) 
由 于 五 线性 依赖 于 w, 可 能 出 现 奇异 解 。 若 对 和 矩 阵 B 进行 正 交 变换 , 则 因 rankB8 二 7 ,系统 
中 必 有 7 维 状 态 向 量 em G2) 为 控制 向 量 w(z) 所 约束 ,而 另外 (mn 一 r) 维 状态 向 量 x, (21) 与 控 
制 w(z) 无 直接 关系 , 仅 通过 x1(2) 与 u(z) 相 关 。 车 取 x1() 作 为 新 假设 的 控制 向 量 ,x,(z) 作 
为 新 的 状态 向 量 ， 人 控制 同 题 转换 为 如 下 非 奇异 最 优 控制 问题 。 
问题 8-4” 设 线性 定常 系统 方程 
X21t) = Axst) + Br) (8-63) 
性 能 指标 


ME C2) +xT Qix20) dt (8-64) 
式 中 4) 为 矩阵 4 经 正 交 变换 后 的 (n 一 r) X (n 一 x) 维 分 块 矩 阵 ;B, 是 矩阵 B 经 正 交 恋 换 


后 的 (n 一 r) Xr 维 分 块 逢 阵 ;R 和 Q, 是 权 和 矩阵 8 经 正 交 变换 后 ,分 别 对 应 于 x Ct) 和 xs() 
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的 >Xr 维 和 Cn 一 r) X (2 一 >) 维 分 块 权 和 矩阵 。 要 求 正常 最 优 控制 立 (t) 和 正常 最 优 轨 线 
xy (t) ,使 性 能 指标 (8-64) 极 小 ,从 而 求 得 问题 8-3 要 求 的 奇异 最 优 控制 a" (t) 和 奇异 最 优 


轴线 x (4)。 
引 理 8-1 设 4 是 mxXn 维 矩 阵 , 则 存在 mx 阶 正 交 和 矩 阵 V 和 阶 正 交 和 矩阵 上 ,使 
viAU=| | (8-65) 
0 0 
式 中 
A=diag {a yas,*** ,0,} (8-66) 


而 oz 一 1,2,…7, 是 4 4 的 全 部 正 特征 值 。 
推论 设 B 为 nxXm 维 矩 阵 ,rank8B= 二 =r 二 m, 则 必 存 在 n 阶 正 交 和 窍 阵 V, 使 得 


B, : 
V B= |, | (8-67) 
式 中 Bb 为 rxXm 维 定 阵 。 
证 明 由 引 理 8-1 知 , 下 式 成 立 : 
T _ A 0 
y p0=| | 
令 正 交 咎 阵 
T 和 | 
U 一 t7 一 
U, U, 


式 中 UU 为 rXl 和 矩阵 ,Us 为 rX(m 一 站 矩 阵 ,U, 为 (m 一 r) Xl 入 阵 ,U 为 (Gm 一 r)X (Cm 一 1) 


矩阵 。 则 有 
1»_ [A 0 ， fAaU: AU,] fa， 
vp=| oo -| 0 1 |-| 
式 中 B81 二 LAU， ADU; 为 rXm 维 矩 阵 。 
定理 8-3 对 于 给 定 的 奇异 控制 问题 8-3, 如 下 结论 成 立 : 


所 给 奇异 控制 问题 可 以 转化 为 如 下 非 奇异 控制 问题 。 
X (tt) 一 上 at 十 性 ) (8-68) 


/=] [x (£)Q11x1 C2) 2x (tOQ isx 2) x2 (£)OQ2xs C(t) Id (8-69) 


式 中 x1€ R’,z2€ R"' 分 别 为 正 交 变换 后 的 分 状态 向 量 ;4,、A, 为 矩阵 4 去 正 交 变 换 后 的 
分 块 矩 阵 ;Qu、Q1;、Qz: 为 权 和 矩阵 8 经 正 交 变换 后 的 分 块 矩 阵 。 
书 原 奇异 控制 问题 8-3 的 奇异 解 满足 如 二 方程， 
X (2)= Axr (2) Asx2 (CE 十 再 人) (8-70) 
式 中 41、4; 和 B, 分 别 为 矩阵 4 和 B 经 正 交 变 换 后 的 分 块 矩 阵 。 
(3) 当 rank8 二 +r 二 m 时 ,奇异 解 存 在 且 唯 一 ;车 rr 二 m, 则 奇异 解 不 唯一 。 
证 明 根据 推论 ,对 系统 (8-60) 进 行 如 下 线性 变换 
x(t)=V'x() 
式 中 VV=VV "=J。 则 原 系统 (8-60) 变 为 
X(t)= Ax(t) + Bult) 
.278 。 


而 原 性 能 指标 (8-61) 变 为 
J=| x (Or)d 


式 中 
_ A A, 一 一 如 ， 
iay-[4 |], we-[4 
A; A, 
7-yroy I | 
1 0Q2: 
设 xG) 二 [xi(t) x2(1)], 则 有 : 
X14) = Ax (7) Axi i) Bu(t) (8-71) 
,ft) = Ax, (tT A rx (i) (8-72) 
7=] [x1 (O11x (D+ 2x1 (Qiax2 (1) tT x2 (1)Qo2xa lt) Jd (8-73) 


证 得 式 (8- 68) 及 式 (8- 69) 成 立 。 显然 , 式 (8-68) 及 式 (8-69) 构 成 非 奇 异 最 优 控制 问题 , 且 
与 原 奇 异 最 优 控制 问题 8-3 等 价 。 其 中 ,xi1(t) ER', 设 为 新 的 控制 向 量 ;xs(t)E€ R*', 设 为 
新 的 状态 向 量 。 

对 于 式 (8-68) 和 式 (8-69) 构 成 的 非 奇 异 最 优 控制 问题 ,可 以 直接 采用 极 小 值 原 理 的 
方法 求解 ,得 到 最 优 解 x? (1) 和 xi (1), 以 及 最 优 性 能 指标 J*"。 将 x (和 2 (2) 代 入 式 
(8-71) ,证 得 式 (8-70) 成 立 。 由 于 好 (G4) 和 x? (1) 是 使 性 能 指标 (8-69) 极 小 的 最 优 解 , 故 满 
足 式 (8-70) 的 wu* (2) 是 使 原 系 统 性 能 指标 (8-61) 为 极 小 的 奇异 最 优 控 制 。 原 系统 的 奇异 最 
优 轨 线 为 

X (1t)=V x’ Q) (8-74) 

从 式 (8-70) 可 以 明显 看 出 ,因为 x1()ER',wu(t)ER”, 表 上 明 + 个 方程 中 含有 m 个 未 知 
数 。 所 以 , 当 r 二 m 时 ,其 中 必定 至 少 存在 mr 一 r 个 自由 变量 ,最 优 解 wu" () 可 能 不 唯一 ;但 
当 y 一 m 时 ,u” (2) 存 在 且 了 唯一 。 

为 了 表明 控制 变量 转移 法 的 有 效 性 , 仍 以 例 8-3 为 例 进行 分 析 。 不 难 求 得 例 8-3 系统 
的 正 交 矩阵 为 


1 1 
V2 V2 
YY 一 
1 1 
V2 v2 
相应 算得 
1 1 
2 2 加 
| 
1 1 0 
2 2 
1 1 
7- 4 4 
1 1 
4 4 
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设 x=[Lzl zzj] ,由 式 (8-71) 一 式 (8-73) 可 得 


志 一 一 广 五 十 广 五 二 VV 2u 


2 
一 了 一 了 一 
及 二 2 ?2 2 1 
‘ft{ 1— 1 1— 
/=| "| 本 2 TT Frit dt 
令 哈 窗 顿 阴 数 
H=7 (Zt27z +2) + AF) 
由 极 小 值 原理 ,得 
_ >” 1 ee— 一 -一 
Ts 5 (TT1) 
一 一 
一 一 7 了 (ZI 十 ZeT 人 4) 
aH _1 一 一 、 
dz 2 (zi 十 工 ， A) 二 0 
解 得 


A= zl 十 XT 二 CI@ 一 


一 上 


一 ] 
Ta» 一 cze 十 本 ce 


Ce 


TX? 一 一 Ce 一 一 Coe: 
4 l 2 
*  _Y2 _: /ss.. 
ww A CE 7 2 Coe 


式 中 cl 和 cs 为 每 定常 数 。 
作 反 变换 x* 二 Vx" ,可 得 


证 


一 (十 )= rae 


V2 
by = 一 和 ) 一 生生 (4cxe 一 ce 
令 t 二 0, 代 入 已 知 的 xz1(0) 和 xz;(0), 易 得 


1] -一 V 2 x1(0) 


C2 2. (0) + 2x.00) 


于 是 ,奇异 最 优 控制 
zx (1)=—~—zi(0)cosht— zs(0)e'=— [x(t) tr)] 
可 寞 最 优 轨 线 
Xi (tf)=xi(0)e 一 
Xs (1t)—= zi(0)sinht zx, (0)e: 
上 述 结果 与 例 8-3 的 结果 完全 一 致 。 
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8.3 看 线性 系统 的 奇异 最 优 控制 


本 节 研 究 的 非 线性 系统 奇异 最 优 控制 问题 ,其 系统 状态 方程 对 状态 x (2) 是 非 线性 
的 ,但 对 控制 w(t) 是 线性 的 ;性 能 指标 设 为 末 值 型 ,因而 哈密 顿 函数 五 对 控制 w(2) 仍 是 线 
性 的 ,对 状态 xG) 则 是 非 线 性 的 。 这 当然 不 是 最 普遍 的 情况 ,但 却 包 含 了 实际 应 用 中 大 多 
数 的 重要 情况 。 此 外 ,为 了 便于 研究 , 设 控制 x(t) 为 标量 ,因而 决定 的 奇异 控制 也 是 标量 ， 
但 这 并 不 失 一 般 性 ,因为 在 控制 为 向 量 的 情况 下 ,可 个 别 地 适用 于 wx(i) 的 分 量 。 

问题 8-5 已 知 非 线性 单 输入 系统 方程 

X(t)= f(x)b x u(t) (8-75) 

式 中 x(2) 为 n 维 状态 同 量 ,uw() 为 标量 控制 ,f(x) 和 6b(x) 是 x() 的 维 向 量 函 数 。 

要 求 选择 满足 不 等 式 约束 


uC) |<1 (8-76) 
的 最 优 控制 u* (2) ,使 系统 (8-75) 由 已 知 初 态 
X(to) 一 Xo 《8-77 ) 
在 未 态 时 刻 疼 记 加 到达 目标 集 
S$ Lz) j=0 (8-78) 
并 使 未 值 型 性 能 指标 
J=qG x(t) | (8-79) 


极 小 。 其 中 Y 5(，) 是 末 态 x(y) 的 + 维 也 数 向 量 ,tjy 固定 。: 
在 上 述 问 题 中 , 末 值 型 指标 并 不 是 一 种 限制 ,真正 的 限制 是 要 求 哈密 顿 函 数 矿 对 控 


制 x() 是 线性 的 。 
对 问题 8-5, 构 造 哈密 顿 焉 数 
H=A CG) fx) HAT Cb ruG) (8-80) 
根据 极 小 值 原理 ,应 有 
正则 方程 
XT)= f(x) Hb x uz) (8-81) 
4)=— 2 4 ( )— 2 CA (uC) (8-82) 
边界 条 件 
X(to) = Ko (8-83) 
; z 
A (7) = 9+ 27 | (8-84) 
‘Ff 
yp Lx(t) |=0 (8-85) 
极 值 条 件 
H*=minH 
I 1 
即 : z 
2 (1)=—sgn (X(t) bx)) (8-86) 


解 式 (8-81) 一 式 (8-86) 的 两 点 边界 问题 ,可 得 正常 解 。 
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如 果 存 在 某 一 时 间 间 隔 [a ,ts]C [ost/], 使 得 
TXB) =0 (8-87) 
则 可 能 出 现 奇异 解 。 因 为 式 (8-87) 中 不 出 现 w(4), 所 以 由 式 (8-87) 不 能 直接 确定 奇异 解 
u(x,A)。 考 虑 到 二 的 各 阶 导数 为 零 ,进一步 考察 


d a aT T 
9| 5 XD) AT Dx) 
=XC) EC) +AT Bx) =0 (8-88) 
在 式 (8-88) 中 ,代入 式 (8-81) 和 式 (8-82), 经 整理 后 可 得 | 
d /39H z 
| =AT(Dg(x)=0 (8-89) 
式 中 
_9b'(x) _9f'(x) 
q(x)= 3 fx) 了 blx) (8-90) 
在 式 (8-89) 中 ,由 于 含 w(z) 各 项 全 部 对 消 , 故 由 式 (8-89) 也 无 法 确定 u(x,4)。 继 续 考 察 
| =X G0 tA Dg A) Ee) + A) gx) 
A 3 Ef +tb Ou) A + wl) gcx) 
=Xt) | 2 和 5 和? 9g (7) rz) 一 gx) | 
二 NGD| 2 人) Cr) 32 gx) lat) =0 (8-91) 
式 (8-91) 中 包含 有 w(t) 项 。 若 
,Tog' (x) 2 人 
人 | 2 blx)— g(x) (#0 (8-92) 
则 由 式 (8-91) 可 得 奇异 弧 上 的 最 优 控 制 
T 
XR) | Sf) — 2 gx) | 
u(t)=— (8-93) 


9gq' (x) 2 人 
Xe) | -2 bx)— XI gx ) | 


如 果 从 菜 一 时 刻 开始 , 式 C8.87) 和 式 C8.80) 成 训 出 站 Cc )2n 维 空间 中 ,可 以 确定 
2n 一 2 维 奇 异 超 曲面 ,控制 律 (8-93) 能 维持 条 件 (8-87) 成 立 。 以 2n 一 2 维 奇 异 超 曲 面 上 的 
点 作为 初始 条 件 , 若 问 题 存在 奇异 解 , 则 奇异 控制 (8-93) 所 决定 的 奇异 弧 必 在 该 2 一 2 维 
奇异 超 曲面 上 。 
在 问题 8-5 中 , 若 末端 时 刻 尹 自由 , 则 沿 最 优 轨 线 ,哈密 顿 函数 
H=ACG)[L fr)+b (ru) |=0 (8-94) 
由 于 在 奇异 弧 上 满足 


SX bx) =0 
于 


故 有 
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H=A(t) f(x)=0 (8-95) 
根据 式 (8-95), 可 以 确定 最 优 末端 时 刻 女 。 这 时 ,由 式 (8-87)、 式 48-89) 和 去 (8-95) 共 同 确 
定 一 个 2 一 3 维 奇 异 超 曲面 ,其 描述 方程 为 
AT(i)b Cx)=0 
orc (8-96) 
: A'(t)f (x)=0 
式 (8-96) 为 4 (4) 的 线性 齐 次 方程 ,对 于 n= 二 3 的 定常 问题 8-5, 式 (8-96) 有 非 零 解 的 条 件 是 
Ai) 构成 的 系数 行列 式 为 零 。 
例 8-4 人 研究 探 空 火箭 最 大 上 升 高 度 的 推力 控制 问题 。 已 知 单 级 探 室 火 箭 的 运动 方 
程 为 


.,、 1] 加 加 _ 

v1) = Lt) Dlv,h) |—g (8-97) 
A(t)=v() (8-98) 
万 (站 一 一 一 正人) (8-99 ) 


式 中 v(2) 为 火箭 垂直 速度 ,h(2) 为 火 第 飞行 高 度 ,m(z) 为 火箭 质量 ,F(z) 为 火箭 推力 , 即 控 
制 变量 ,DCwv,h) 为 空气 阻力 ,与 v() 及 h(t) 有 关 ,g 为 重力 加 速度 , 视 为 常数 ,c 为 单位 质 
量 燃料 燃烧 所 产生 的 推力 , 称 为 比 推力 ,也 是 一 个 常数 。 推 进 剂 总 量 固 定 。 

设 端 点 条 件 


v0)=0, 由 (0) 一 0，  m(0)=mo (8-100) 
v(t/)=0, m(tr) = mi (8-101) 

推力 约束 
OQF (1) EF (8-102) 


要 求 设计 满足 约束 条 件 (8-102) 的 最 优 推力 程序 F* (2) ,使 探 空 火箭 终点 高 度 为 最 大 ,或 
者 说 ,使 如 下 性 能 指标 : 


J=—h(y) (8-103) 
为 极 小 ,其 中 自由。 
构造 哈密 顿 函数 
H=%| -| 十 NV 一 A 二 (8-104) 
m C 
根据 极 小 值 原 理 可 得 ， 
协 态 方程 
AH_AIDGh) 
二 J A (8-105) 
,9H _4,93D(y,h) 
心 一 gh mm (8-106) 
, aH F—D 
ei py +. (8-107) 
边界 条 件 
v(t/)=0 (8-108) 
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Atr) 一 一 ] (8-109) 


m(t/)=0 : (8-110) 
H 函数 沿 最 优 轨 线 变化 律 : 
H* CO 一 | “8) itr (8-111) 
极 小 值 条 件 
H*= min H (8-112) 
由 于 式 (8-104) 表 示 的 哈密 顿 困 数 可 与 为 
杂 =| 人 一 名 | +h -| 元 te (8-113) 
故 通 过 使 
| 人 一 全 |F=min 


可 给 出 H 函数 相对 下 (2) 的 极 小 值 。 产生 最 大 飞行 高 度 的 推力 FG) 有 三 种 可 能 解 : 
OD 车 | 全 一 袍 | >0, 则 取 F()=0 


mm 

加 车 | 宁 一 凶 | <0, 则 取 FPC) = 

加 着 | 全 一 =0, 则 取 0 过 FG) 二 Fw。 
nt C 


由 于 哈密 顿 函数 妃 相对 推力 下 人) 为 线性 关系 , 故 可 能 出 现 奇异 情况 。 在 奇异 狐 上 ， 
显然 有 
aH 


FF mAn= 0 (8-114) 
所 | 5 | cA—mA,—mAaA,=0 
将 式 (8-99)、 式 (8-105) 和 式 (8-107) 代 入 上 式 , 得 
2|e 区 一 E+D 一 ci 十 二 一 0 


以 j2 乘 上 式 两 端 , 有 
CA, (hm) + DA em =0 
vy Cc 


由 于 式 (8-114) 成 立 , 所 以 上 式 等 号 两 边 同 除 c 得 
5 守 |= + 二 :一 m=0 (8-115) 
由 式 (8-111)、 式 (8-114) 和 式 (8-115) 齐 次 方程 组 可 见 , 在 (x,4 ) 六 维 空间 中 ,该 齐 次 
方程 组 构成 如 下 三 维 奇 异 超 曲 面 : 
to 一 一 一 0 
ch 一 mh 一 0 (8-116) 
加 +9j4m 
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在 方程 组 (8-116) 中 , 知 系 数 和 矩阵 非 奇异 , 则 只 有 有 零 解 

多 一 水 一 人 一 0 
显然 ,这 不 是 我 们 所 要 达到 的 目的 ; 若 其 系数 和 矩阵 育 异 , 则 齐 次 方程 组 (8-116) 有 非 零 解 。 
这 时 , 称 齐 次 方程 组 (8-116) 是 相 容 的 。 因 而 , 相 容 性 要 求 


一 已 _ »y 也 
m 所 和 ， 

C 0 —7m | 二 0 (8-117) 
39D D —7 0 
oF C 

将 式 (8-117) 按 第 二 行 展开 ,得 Gy,h,m) 三 维 空间 中 一 个 奇异 超 曲面 方程 
Vv aD 

Dimg— Dr gy—0 (8-118) 


可 异 弧 必 位 于 式 (8-118) 描 述 的 奇异 超 曲 面 上 。 再 令 


d 193 瑟 7 . aD. li19D. 93D. 
[|= | 0 | 人 5 十 及 
十 基态 一 到 一 mm 忆 一 0 (8-119) 
将 式 (8-97) 一 式 (8-99) . 式 (8-105) 、 式 (8-106) 代 入 式 (8-119) ,经 整理 得 
9 DD, oD 9a:D 号 
F||。 可 这 5 | 入 十 ma 下 
—mpg aD (my— em)a 2 | me 二 < 十 D) 一 0 (8-120) 
在 式 (8-120) 中 , 代 人 式 (8-115), 并 以 c/% 问 来 等 式 两 遇 得 
| (D+2c te | F= D| p+2c 9 4c? C | 十 mag| ec Ste 2 | 
Ov dv 7 
D 用 a “万 
tm| (c 一 co5 一 c ap 


为 简化 结果 ， 和 有 


D+2c 完 一 一 十 Cc“ 9 |F =D| D+2c So te S| 二 mg| D+2c oo av te 9 D2 
aD aD 9D 
tm| cc 一 六 5 入 一 PC elDte gy | 
最 后 得 奇异 最 优 控制 
F* (D=D+mgt+—o— Sp| — s| Dte ss 
a9D , ,9°D av 
D2c 一 一 十 CC 一 7 
dy oy 
_ ,aD_ ys 9D 
te(c—v) a | (8-121) 


式 (8-121) 表 明 ,在 奇异 弧 上 ,最 优 推力 为 非 线 性 反馈 律 。 

通常 ,空气 阻力 DGY,h) 是 v 和 的 单调 函数 ， 疏 推力 控制 过 程 一 般 为 邦 - 奇 - 邦 过 程 ， 
包括 如 下 三 段 : 

(DF 二 Fw， 直到 满足 奇异 超 曲 面 方 程 (8-118) , 相 点 (y,h,m) 到 达 奇 异 超 曲面 为 止 , 形 
成 最 大 推力 邦 - 邦 弧 。 
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凶 采 用 状态 反馈 律 (8-121) 得 出 奇异 弧 ,使 相 点 (在 奇异 超 曲 面 上 沿 特 定 奇 蜡 
弧 运 动 , 直 至 关 王 mr) 为 止 , 形 成 非 线 性 奇 借 控制 。 

(3) 取 Ff=0, 探 空 火 箭 靠 惯性 继续 上 升 ,直至 v= 二 0 为止 。 

应 当 指 出 ,在 下 二 Fwx 最 大 推力 弧 尚 未 到 达 奇 异 超 曲 面 (8-118) 之 前 ,推进 剂 就 可 能 已 
经 耗 完 ,; 即 mm 一 m(zty) ,从 而 在 解 中 不 出 现 奇异 弧 ,这 正好 是 D==0( 无 空气 阻力 ) 的 情况 , 奇 
弄 超 曲 面 方 程 简 化 为 m 一 0。 推力 控制 具有 邦 - 邦 形 式 , 不 会 出 现 奇 异 段 。 


8.4 柯 异 最 优 调 节 毅 


当 控 制 受 到 有 界 约 束 时 ,最 优 调节 器 的 控制 方式 不 再 完全 是 线性 的 ,而 会 出 现 两 种 工 
作 方 式 一 一 继 电 方式 和 线性 方式 。 对 于 典型 的 大 初始 状态 值 ,调节 器 首先 工作 在 继 电 方 
式 , 这 时 控制 为 邦 - 邦 控制 ,对 应 的 轨 线 为 正常 弧 ; 当 状态 值 充 分 小 时 ,调节 器 工作 由 继 电 
方式 转 人 请 动 方式 ,或 称 线性 方式 ,并 保持 这 种 调节 方式 直至 达到 零 状 态 , 这 时 的 控制 为 
线性 奇异 控制 ,相应 的 运动 轨 线 为 奇异 弧 。 

本 市 将 应 用 调节 器 理论 求 取 奇 异 最 优 调节 器 的 奇异 解 。 采 用 线性 变换 方法 将 原 奇 异 
再 市 些 问 题 转化 为 标准 调节 器 问题 ,然后 应 用 标准 调节 器 的 结果 给 出 奇异 调节 器 问题 的 
解 。 


8. 4.1 奇异 最 优 调节 器 问题 


问题 8-6 已 知 线 性 时 变 系 统 的 状态 方程 
T(E)—=ACIXOFBOAOuG), xo)—=xo (8-122) 
式 中 x() ER",w(t)E R", 和 矩阵 A(t) 和 BG() 维 数 适当 ,其 各 元 连续 可 微 且 有 界 ， 
要 求 选 择 满 足 不 等 式 约 束 
(uC) [RI j=1,2,.…,m (8-123) 
的 最 优 控制 ua" (2) ,使 性 能 指标 


=| x(x di (8-124) 


为 极 小 。 其 中 Q(z) 为 对 称 非 负 定 矩阵 ,其 各 元 连续 有 界 ,末端 时 刻 tj 固定 。 

为 了 利用 标准 调节 器 的 结果 求 得 奇异 最 优 调节 器 问题 的 奇异 解 , 暂 不 考虑 控制 约束 
《8-123) ,可 利用 线性 变换 方法 将 无 约束 的 奇异 调节 器 转化 为 等 价 的 标准 调节 器 , 即 修 干 
奇 借 调节 器 ;然后 利用 标准 调节 器 的 理论 结果 立即 得 到 修正 的 奇异 调节 器 的 解 ; 再 把 修正 
的 奇异 调节 器 的 解 转 化 为 原 奇 异 调节 器 的 解 ; 最 后 ,考虑 控制 约束 (8-123) 对 所 求 得 的 解 
运 当 修正 ,从 而 得 到 有 控制 约束 的 奇异 最 优 调节 器 问题 8-6 的 奇异 解 。 

自 先 对 原 系 统 状态 方程 (8-122) 进 行 线 性 变换 。 令 

xX1(t)=x(t)— BO)u C0) (8-125) 
Ui(t)=u(t) (8-126) 
对 式 (8-125) 等 式 两 端 取 一 阶 导 数 , 得 
X11) = — BOOuG) — BG)u, CE) 
=AC(D) x) — BW) + [AGBG)— Bu) uC) 
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一 4(C1)YI CB (tui(t) (8-127) 
式 中 
Bi(t)=AG)BG)—BU) (8-128) 
此 时 , 式 (8-127) 还 不 是 最 后 的 变型 状态 方程 ,有 待 进一步 变换 。 
然后 对 原 性 能 指标 (8-124) 进 行 线性 变换 。 将 式 (8-125) 代 人 性 能 指标 (8-124) ,可 得 


J =| [e+ Bm TOW Te +B me) dt 


=| [x QO +2 Wu tu Rm) dt (8-129) 


式 中 
H(t)=O()B() (8-130) 


RG)=B' G00G)BG) / (8-131) 
对 式 (8-129) 中 的 被 积 函数 进行 配方 , 令 
Xi (LO x Hx Hu 0) tu (GRC u(t) 
=xi (2 OG) TAQGG) jx [Lai A GG) TT RG tAuG)] (8-132) 
将 式 (8-132) 右 端 乘 开 , 并 假定 式 (8-131) 定 义 的 R(z)>0, 可 得 


Ar (i)=R GH (rx G0) (8-133) 
AQ(G)=—HOR (HO) (8-134) 
于 是 ,性 能 指标 (8-129) 可 以 写 为 
J=| Eee (Ax C2) ut RW, C0) di (8-135) 
式 中 
Q1(2)—=O0)— HOOR GH' GG) (8-136) 
Ut) =u (tt) RIGHT Gx CE) (8-137) 


作为 性 能 指标 ,在 式 (8-135) 中 ,要 求 0.(1) 和 RG) 分 别 为 对 称 非 负 定 和 对 称 正 定 算 
隆 。 QO1() 和 RG) 的 对 称 性 是 显然 的 。 如 果 Q(t) 汪 0, 自 rankB(4) 一 m, 则 由 定义 式 (8- 
131) 可 见 , 必 有 RR() 二 0。 对 于 QC) 宕 0 情形 ,也 存在 许多 可 能 的 矩阵 BG(), 可 以 使 得 民 
(1)0。 如 末 RC() 不 满足 正定 性 条 件 , 则 还 要 进行 变换 ,直到 正定 性 成 立 。 在 以 下 的 讨论 
中 ,我 们 总 是 认为 R()0 成 立 。 至 于 Q1() 的 非 负 定 性 ,可 见 以 下 命题 ， 
命题 8-1 若 C(G) 志 0,RGD)y0, 必 有 
Q1(t)=Q0)—HOR (OH' (之 0 
证 明 由 于 OG) 宇 0, 故 有 
x (OOOxXCG) x OX) EHR OAHTOOX TRG 
Lao (ti 十 民 CH (Dx) 0, VY x(t) 
选择 
u(t)=—R GH CG)xr(t) 
可 得 | 
Xi (LQ)x (0, Vx (tt) 
内 此 必 有 C@ CO 全 0。 
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由 于 性 能 指标 (8-135) 中 不 含 uw1(2) ,而 含 Wz(2) ,因此 对 变型 状态 方程 (8-127) 可 作 进 
一 步 变换 。 将 式 (8-137) 代 入 式 (8-127), 可 得 
Xi1(t) = A X(T Bi (tu (i) (8-138) 
式 中 
Ai(2)=A()— BC)R (Hz) (8-139) 
于 是 ,修正 的 奇异 最 优 调 节 器 问题 可 以 归纳 如 下 。 
问题 8-7 对 于 问题 8-6, 当 和 暂 不 考虑 控制 约束 (8-123) 时 ,其 等 价 的 修正 奇异 调节 器 
问题 为 :已 知 线性 时 变 系 统 状 态 方 程 
X12) = A (Fx (TB (u(t) 
Xi(to)=xX(to) — Blto) u(to) 


(8-140) 


性 能 指标 


‘Ff 
J=), txrcg, CX) Hu RG uC) ldt (8-141) 
式 中 Qi1() 和 RC) 分别 为 对 称 非 负 定 和 正定 矩阵 ,其 各 元 连续 且 有 界 。 要 求 最 优 控 制 
uz () 使 性 能 指标 (8-141) 极 小 。 其 中 xi C2) 满足 式 (8-125) ,41(2) 满 足 式 (8-139) ,Bi(i) 满 
是 式 (8-128) ,w(t) 满 足 式 (8-137) ,0 (满足 式 (8-136) ,RG) 满 足 式 (8-131)， 
问题 8-7 属于 标准 调节 器 问题 ,根据 本 书 第 5 章 介 绍 的 状态 调节 器 理论 ,可 以 给 出 其 
最 优 解 结果 。 


8. 4.2 ”控制 无 约束 时 的 奇异 解 


由 定理 5-1 知 ,修正 的 奇异 调节 器 问题 8-7 的 最 优 控制 为 
U2 (t)=—K()x(t) (8-142) 
式 中 
KG)=R (BT PY) (8-143) 
而 P() 是 满足 如 下 歼 卡 提 和 矩阵 微分 方程 的 对 称 非 负 定 矩阵 
—P()=P()A +AT HPG)—POB CR GBICPG HOG (8-144) 
其 边界 条 件 为 


: Pu)=0 (8-145) 
将 式 (8-137)、 式 (8-131)、 式 (8-128) 及 式 (8-130) 代 入 式 (8-142), 可 得 
Ul (2)=— Ki(t)x(t) (8-146) 


式 中 
Ki1(1)=R (| Bi (PG)+HT())] 
=[B (OBG) 1BTCGDIL4TCGDP(CD 十 OCGD)] 一 有 TCDPCD)) (8-147) 
为 修正 的 奇异 调节 器 的 m Xn 维 反馈 增益 矩阵 。 
将 式 (8-139) . 式 (8-136) 代 入 式 (8-144) ,有 
PO)=PO)LAG)—B OR HOTA — BR AHTHU) TTPO) 
PB (CR ABI DPG HOU — HORT CGH) (8-148) 
因为 
Ki (2)B (OG)BG KG SEPOB G+HG) IR 0) BY) 
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QBOR (EBIOPO+HTG) I=POB RI OH GHHOR (HB 0)PQ) 
PGBICOOR GBI OPO THOOR (DH () 
所 以 黎 卡 提 方 程 (8-148) 可 与 为 
—PG)=PG)AG)+ATHPG)— {POG)B OR OH GHHOR (Bi (PO) 
+POOB OR GB PG-HOR OH (十 CD) 
一 PCA4(CD 十 4 CPO)— Ki GB (OG)BOKG) THOU) (8-149) 
由 定理 5-1, 最 优 性 能 指标 为 
J * =xi (10)P(t0) x (to) (8-150) 
修正 的 育 异 最 优 调节 天 的 结构 图 如 图 8-7 所 示 。 


R (HO) 
—R™(N{B OPOO+H 


图 8-7 修正 奇 措 最 优 调 节 器 结构 图 


以 上 结果 可 归纳 为 如 下 定理 。 

定理 8-4 对 于 修正 的 奇异 最 优 调节 璐 问题 8-7, 其 最 优 控 制 如 式 (8-146) 所 示 , 最 优 
性 能 指标 如 式 (8-150) 所 示 。 其 中 Ki1(2) 满 足 式 (8-147) ,PG() 满 足 黎 卡 提 方 程 (8-148) 及 其 
边 守 条 件 (8-145) 。 各 变量 之 间 满 足 如 下 关系 (对 所 有 的 总， 


(1) P(t1)B(i)=0 (8-151) 

©) Ki,(t)B(t)=1 (8-152) 

(3) 1’ =x (to)P(o)x (to) (8-153) 

(4) Ki(t)x(t)=0 (8-154) 

证 明 (PC()B(z) 二 0, 以 矩阵 B() 右 乘 黎 卡 提 方程 (8-148) 及 其 边界 条 件 (8-145) 的 
两 边 , 可 得 


—PB=P(A—BIR 'H')B+(A—BR 'H'™)'PB 
—PBIR 'BiPB+ (QO— HR 'H')B 
P(t1/)B=0 (8-155) 
将 式 (8-130)、 式 (8-131) 及 式 (8-128) 代 人 式 (8-155), 有 
—PB=PB++(A'—HR 'B!— PB,R ‘Bi)PB 
P(t/)B=0 (8-156) 
因为 
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d pp Dr 
(PB)= PB— PB 


所 以 
— (PB) =(A'— HR BI—PBR Bi)PB 
P(t/:)B=0 
上 述 齐 次 微分 方程 是 下 列 齐 次 微分 方程 
© (PB)—(A'— HR-'BI—PBR-'BT)PB 《8-157) 


的 伴随 方程 。 今 设 原 方程 (8-157) 的 状态 转移 矩阵 为 四 (tt), 则 伴随 方程 (8-156) 的 状态 
转移 矩阵 
BD to) = [Bt0) = (0 ,1) (8-158) 


于 是 , 齐 次 微分 方程 (8-157) 的 解 为 
PB=®@ 1(t,1) (PB), =® (#4,1) (PB),, 
由 于 各 (zy, 四 非 奇异 , (PB), 一 0, 必 有 
PB=0, Vt 
GK (CD)BCGD) 一 rr。 将 式 (8-147) 的 两 边 右 乘 矩 阵 BG) ,可 得 
Ki(2)B()=R CG) BI CPG) HH () BCG) 
代入 PQ)BG)= 二 0 以 及 H'G)BG)= 二 RG) ,证 得 
z Ki(1)BG)=I1, Vi 
对 上 式微 分 ,可 得 
Ki()BOG)+KIGBG)=0 (8-159) 
BJ "= 二 x (to0)P(ioO)x(to)。 将 式 (8-125) 代 人 最 优 性 能 指标 (8-150) ,可 得 
"=X (to)P(to)xz(to) 一 X (0)PG0) Bo) ur (to) 
—uUr (GOB (OPGOxCGo) ur (0B YPG)BGo ur (0) 
由 式 (8-151) 知 
P()B()=B G)PG)—0, YL 
因而 式 (8-153) 成 立 。 
KG) 一 0。 对 于 (0) 一 性 (1), 有 
开 Ct)X(Ct) 一 天 (CD)LXiC) 十 再 (DR (CD) | 
=—=K(t) x(t)T KR (tBu (i) 
在 上 式 中 ,代入 式 (8-146) 和 式 (8-152) ,立即 证 得 式 (8-154)。 
求 得 修正 的 奇异 最 优 调节 器 问题 8-7 的 解 以 后 ,需要 转 回 到 控制 无 约束 时 , 原 奇 异 最 
优 调 市 带 问 题 8-6 的 解 。 由 于 式 (8-125) 成 立 , 因 此 在 转换 过 程 中 ,应 满足 如 下 边界 约束 
X(t0)=x to) Bo ur (to) (8-160) 
式 中 x(to) 是 原 奇 异 最 优 调节 器 问题 中 任意 给 定 的 初 态 。 因 此 ,修正 奇异 调节 器 中 的 初 态 
xi(t) 不 能 是 任意 的 ,必须 满足 边界 约束 (8-160) ,否则 修正 的 奇异 调节 器 的 解 将 失去 其 应 
有 的 意义 。 当 :一 如 时 ,由 定理 8-4 知 
ur (£0)=— Kto) x to) 
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故 边界 约束 (8-160) 又 可 表示 为 
Xto) = ri (to — Bto) KR to) x to) (8-161) 
可 以 证 明 , 式 (8-154) 是 修正 的 奇异 最 优 调 节 玫 的 解 , 可 以 转 回 为 原 琳 弄 最 优 调 广 冀 的 解 
的 充分 必要 条 件 。 
命题 8-2 边界 约束 条 件 (8-161) 成 立 的 充分 必要 条 件 是 
Ki(t)x(t)—=0, Vt 
证 明 ”必要 性 ; 设 式 (8-161) 成 立 , 以 矩阵 Kio) 左 乘 式 (8-161) 两 边 ,可 得 
Ki(toOOx(to)—=KR tox to) — Ki (to0) BOK (to0)xi to) 
由 式 (8-152) 知 
Ki(t0)B(to)=1 
上 元 Ki (toO)x (lo) 二 0, 必要 性 得 证 。 
充分 性 : 设 Ki(o)x(io) 二 0, 任 选 x(to) 二 xi(zto), 于 是 有 
Ki(toO)x(to)=Ki(to)xi (to)=0 


即 

Ur (to)=— Ki(to)xi(to)=0 
因此 

X(to)—xi(to) Bo ur (to) 
充分 性 得 证 。 


为 了 把 修正 的 奇 虹 最 优 调节 器 的 解 转 回 为 原 奇 异 最 优 调节 器 的 解 ,我们 除了 要 求 在 
:一 如 时 关系 式 (8-125) 成 立 以 外 ,还 要 求 巡回 时 ,该 式 也 能 成 立 。 
命题 8-3 若 关 系 式 
X(t)=x1(0) + Bur () (8-162) 
在 上 一 如 时 成 立 , 则 对 于 所 有 三 加 ,该 式 仍 然 成 立 。 
证 明 因为 


Lx) x BW J) A BO CD 一 再 COar 人 
在 上 式 中 代入 式 (8-122)、 式 (8-127)、 式 (8-126) 以 及 式 (8-128), 可 得 
Fx) a (1) — BOG)ur CE) | 


=ACDLXCG)—x C0) — BG ur CE) (8-163) 
式 (8-163) 为 齐 次 微分 方程 , 若 设 其 状态 转移 阵 为 @ f1,to) , 则 方程 (8-163) 的 解 为 
[x (DD—x DD—BOu (= ) [x(t) — x (to)— Buu 人) (8-164) 
在 式 (8-164) 中 ,@; (t,to) 为 非 奇 异 矩 阵 , 且 由 已 知 条 件 
X(to)=xi(to) Blo ur (10) 
故 证 得 z 
X(t)=x1(t)+B(ur GG), (Yi) 
由 命题 8-2 及 命题 8-3 知 ,修正 的 奇异 调节 器 的 最 优 解 必 可 转化 为 原 奇 异 调节 器 的 
最 优 解 。 
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8.4.3 控制 约束 条 件 下 的 奇异 解 


当 不 考虑 控制 约束 (8-123) 时 ,修正 的 奇 寞 调 方 胡 的 最 优 控 制 为 
ur (£1) = K(x (i) 
由 式 (8-126) 知 , 原 奇 异 调 节 兹 的 最 优 控 制 


2 (1)—ur (#) 一 [一 天 (Xi CD) | 一 一 天 (Ci)Y KGCE) 一 下 (Ct) (tt) (8-165 ) 


将 式 (8-125)、 式 (8-127), 式 (8-128) 以 及 式 (8-159) 代 入 式 (8-165), 得 
8 (1)=— [KG()AG)TFKR GG) |xC) (8-166) 
式 中 站 ; (4) 满足 式 (8-147),P(2) 满 足 歼 卡 提 方 程 (8-149) 及 其 边界 条 件 (8-145)。 
修正 的 奇异 调节 器 的 最 优 性 能 指标 (8-150) 已 在 定理 8-4 中 转化 为 原 奇 异 调 节 器 的 
最 优 性 能 指标 (8-153)。 于 是 ,在 不 考虑 控制 约束 (8-123) 时 ,问题 8-6 的 奇异 最 优 控制 为 
式 (8-166) ,奇异 最 优 性 能 指标 为 式 (8-153) 。 
当 考 虑 控制 约束 方程 (8-123) 时 ,由 于 奇异 解 的 取 值 范围 为 一 1<<uj(t) 过 十 1, 故 奇异 
最 优 控 制 (8-166) 应 满足 如 下 约束 方程 
| [LK CACOxXCO) TKR OX) ;<I, j=1,2,.,m (8-167) 
[Kx 一 0， 7 一 1,2，… ,7 (8-168) 
这 两 个 约束 方程 构成 了 奇异 超 曲 面 。 在 奇异 超 曲面 中 , 凡 满 足 式 (8-166) 的 部 分 形成 了 奇 
异 超 曲 面 中 的 一 个 子 集 ,该 子 集 称 为 奇异 带 。 状 态 轨 线 一 旦 进入 奇异 带 , 就 将 保留 在 奇异 
市 内 ,形成 奇异 弧 。 
显然 ,控制 约束 (8-123) 并 不 影响 最 优 性 能 指标 为 式 (8-153) 的 结论 。 


8.5 可 异 最 优 控 制 的 应 用 


本 节 介绍 奇异 最 优 控 制 在 直流 随 动 系统 中 的 应 用 。 这 种 直流 随 动 系 统 可 以 是 由 可 控 
硅 整流 装置 供电 的 双 闭环 调 速 系统 .， 
妈 具 有 负载 扰动 的 直流 随 动 系统 方程 为 
5 一 AR71 
n= bi — bovw 
式 中 s 为 位 置 偏 差 ;n 为 速度 偏差 ;i 为 控制 电流 ;w 为 负载 力矩 次 为 减速 箱 的 减速 比 ;6 
为 Ro/T'wce;bo 为 b/cu; Ro 为 主 回路 总 电阻 ;c。 为 电机 电势 常数 ;cw 为 电机 转 矩 常数 ;T，% 
为 GD Ro/375cccm;GD' 为 飞轮 转 矩 。 
已 知 初 怒 条 件 :s (0) 二 so0,n(0)= 二 mo; 终端 条 件 :s (zy) = 二 0,n(ty) = 二 0; 性 能 指标 /一 


3| Ctegn de. 
控制 约束 : 一 Tx 人 夺 1 全 Ty; 状态 约束 :Nn N;。 
在 状态 变量 约 东 的 内 域 ( 人 和 县 ” 魏 N:), 有 了 哈密 顿 男 数 
H=3 (s+gn’) 十 Alkn 十 4 (bi CO— borw) 
根据 极 小 值 原理 , 求 得 的 正常 控制 为 
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太一 一 VSgn(C4zBP) 

控制 量 在 其 约束 边界 上 取 值 ,形成 邦 - 邦 控制 。 由 于 五 对 i 为 线性 关系, 改 还 存在 柯 弄 控 
制 

.。 po 

1 bY 
其 奇异 弧 表 达 式 为 

V ,二 ((s,n)|s 十 VIn=0,— I ws 2 vw } 
为 了 得 到 全 状态 反馈 的 控制 律 , 使 系统 能 够 稳定 地 工作 ,可 通过 加 上 在 奇异 弧 上 恒 为 
等 的 项 来 修正 奇异 最 优 控 制 律 
i" 一 和 :十 他 ww 十 9(s 十 gn) 


当 状 态 触 及 约束 边界 时 ,根据 状态 受 限 时 的 极 小 值 原理 ,可 求 出 在 约束 边界 上 的 最 优 
控制 律 为 1* 二 (650/6)w。 

在 求解 最 优 开 关 曲 线 时 , 邦 - 邦 控制 只 切换 一 次 便 进入 奇异 控制 。 第 一 段 邦 - 邦 开关 曲 
线 的 求 取 可 通过 求 邦 - 邦 子 驱 的 相 轨 迹 方 程 和 第 一 次 邦 - 邦 开关 时 刻 表 达 式 获得 。 

对 应 于 i* (一 Juy,Tx) 的 开关 曲线 为 


_2 kn 
ew tan 


3 py， 一 ao) 
一 一 一 一 一 一 [io 一 25C7wx 一 和 un) vg] nl[ kn— 360(7 — bo) [| 
9 V kb(ly— Tw) 2 


对 应 于 i* (wy, 一 Tw) 的 开关 曲线 为 


__2 hh /~ 


2 bo 
nt3b( ut pw) Vg J n [hn 3bCTut Tow) [| 


9 V kb(lut Tw) 
若 把 分 段 常 值 负载 w 视 为 变量 , 遍 取 zw 的 允许 值 , 则 在 sn 和 w 组 成 的 三 维 状态 空 
间 中 ,对 应 所 有 w 可 能 值 的 开关 曲线 族 构成 了 开关 曲面 ,如 图 8-8 所 示 。 由 图 可 见 ,开关 
曲面 分 别 由 邦 - 邦 开关 曲线 族 Cu .Ca ,奇异 弧 线 族 和 约束 边界 上 控制 子 弧 mmx 所 构成 
的 空间 平面 组 成 ,并 把 状态 空间 分 为 D+ 和 D- 两 个 子 空间 。 最 优 控制 律 归纳 为 
表 8-1 所 示 。 


表 8-1 最 优 控制 律 
域 D+ 域 D- 约束 边界 奇异 弧 
bo .上 k 28 bo 


1" =—1y 上 “一 一 Tv 上 “一 一 也 {po 
6 la Og 
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图 8-9 下流 随 动 系统 仿真 曲线 
实际 上 ,负载 扰动 无 法 直接 测 得 ,可 以 根据 可 观测 变量 * 和 构造 状态 观测 器 ,得 到 
w 以 代替 上 击 讨 论 的 ww。 
令 5 二 bow， 有 增 广 系统 


则 状态 观测 器 方程 为 
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z= 一 kz 二 ki 十 kn 
y=z— kn 

通常 , 权 系 数 g 的 选取 与 系统 动态 性 能 有 关 。g 值 过 大 ,系统 的 过 渡 过 程 时 间 长 ;gq 值 
过 小 ,系统 又 会 出 现 超 调 。 本 例 选 取 gq 二 9.5X10 。 

当 给 定位 置信 号 为 1 mm ,主要 技术 参数 为 额定 电流 In 二 564 A .额定 转速 nw 二 1000 
rmin、 过 和 载 能 力 2.5 信 .Ro 一 0.058Q ce 一 25.5 V/(r*min 1).cu=0.412 kg* m/A.£= 
0.075 mm/(r。s )、 观 测 颖 极点 选 为 一 10 时 ,计算 机 仿真 结果 如 图 8-9 所 示 。 从 仿真 结 
东 可 见 : 可 异 最 优 控制 系统 综合 了 邦 - 邦 控制 与 线性 反馈 控制 的 优点 ,能 尽快 地 消除 偏差 ， 
市 负载 进入 稳 态 ;控制 规律 及 开关 曲线 可 按 负载 力矩 的 变化 量 进行 在 线 修正 。 


习题 


8-1 已 知 一 阶 系 统 方程 
Z(t)—u(t), zx(0)=1 


控制 约束 :|u(i)| 志 1。 性 能 指标 
J 一 3| x (ft)di 


未 态 要 求 z(2) 二 0.5。 试 求 系统 的 邦 - 邦 解 与 奇异 解 。 
8-2 设 二 阶 系 统 方程 
Z1(t) = x (t) 
at 一 一 Ci) 十 2(CE) 
控制 约束 :|xG)| 委 1。 人 性 能 指标 
J= 了 | Gd: 
式 中 心目 由 。 试 验证 系统 能 否 出 现 奇异 弧 。 
8-3 设 二 阶 可 控 系 统 
Et 一 CGI) 十 Co 人 rz) 
Xslt) =arTi(t) tar lt) tult) 
控制 约束 :|u(z) | 二 1。 性 能 指标 


J=3| [z+ xd) dt 


式 中 自由 。 试 证 明 奇 异 最 优 控制 为 
U 人 《1 一 一 (ai 十 aziG) 一 (ai 十 ar) 人 (zt) 
8-4 ”试用 控制 变量 转移 法 重 作 例 8-2。 
8-5 设 二 阶 非 线 性 定常 系统 
T(t)=7r(t), ZIC0) 一 Zio Cr) 一 zl7 
Zakt) 一 一 ZazCt) 一 2 十 &() 
Z2z(C0) 一 ZT2oy az 人 tr) 一 or 
控制 约束 ;|u(z) | 过 1。 性 能 指标 
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/=| du 一 
式 中 自由 。 试 证 不 存在 奇异 最 优 控制 。 


8-6 已 知 系统 方程 
(4) = 了 (D+ | | 


控制 约束 |u(z)| 奈 1。 性 能 指标 
J= | zf)d 


试用 奇异 调节 器 方法 求 奇异 最 优 控制 w* (4)。 
8-7 已 知 系统 方程 


U 1] 0 O 
(1 ) 一 : 0 e+ 0 u(t) 
0 0 0 ] 


控制 约束 jxz(G)| 委 1。 人 性 能 指标 
J=| [a ++) Jdz 
试用 奇异 调节 需 方 法 求 奇 异 最 优 控制 xz *(z) 。 
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第 9 章 随机 最 优 控制 


在 以 前 各 章 所 研究 的 最 优 控制 问题 中 ,认为 控制 系统 不 受 随机 干扰 作用 ,而 且 假 定 系 
统 的 状态 变量 都 可 直接 获得 ,因此 ,所 研究 的 是 确定 性 系统 的 最 优 控 制 问题 ,实际 上 ,工程 
系统 都 或 多 或 少 地 受到 随机 干扰 的 作用 ,也 常常 不 可 能 获得 状态 的 全 部 信息 ,而 只 能 根据 
量 测 方程 得 到 某 些 不 完全 的 信息 .受到 随机 干扰 作用 的 系统 称 为 随机 系统 ,其 状态 为 随机 
变量 。 本 章 将 考虑 系统 所 受到 的 随机 干扰 或 模型 本 身 的 随机 误差 以 及 量 测 装置 的 量 测 误 
差 和 随机 性 的 初始 状态 ,采用 卡尔 曼 滤波 器 估计 随机 系统 的 状态 ,结合 随机 过 程 理论 研究 
随机 系统 的 最 优 控制 问题 ,由 于 非 线性 系统 的 随机 最 优 控制 问题 非常 复杂 ,几乎 得 不 到 正 
确 的 解 ,因此 本 章 仅 限于 讨论 在 工程 中 已 经 实际 应 用 的 具有 二 次 型 性 能 指标 的 线性 系统 ， 
在 高 斯 ( 正 态 ) 分 布 白 噪声 干扰 作用 下 的 随机 最 优 控制 问题 , 即 所谓 LQG 问题 。 


9.1 随机 噪声 作用 下 的 状态 啊 应 


9.1.1 状态 对 白 皮 声 的 啊 应 
设 线性 时 变 随机 系统 的 状态 方程 为 


天 (人 ) 一 下 人) 人 CE) 二 CCD)NLE) xlto)= ko (9-1) 
式 中 x(2) 为 n 维 随 机 状态 回 量 ,x 是 1 维 随机 初始 状态 ,其 均值 及 方差 阵 分 别 为 
Elx(to) |= mo (9-2) 
Var[l x(t0) |= EL (xo—mo) Crom—mo) |=P, (9-3) 
w (1) 为 等 均值 蜗 斯 日 曲 声 过 程 , 其 统计 特性 
Cov[ w(t) ,wlr) |=ELw(C)w' (Cr) |=0O006()60—7) (9-4) 
Cov[ xi) wr) |] 三 五 | (xo—mow' (rT) |=0 (9-5) 


下 面 逐 个 求 出 随机 向 量 x(2) 的 统计 性 能 。 首 先 , 求 x() 的 均值 。 显 然 ,x(z) 的 均值 满 
足以 下 矩阵 微分 方程 及 初始 条 件 


SLELx C0) I=FOEx() HG ELw GE)], 无 [rdto)] 一 ms (9-6) 
其 解 为 
ELx (DJ=® Ci) mt | BG EC) dr 
z =~®$ ( ,to) mo (9-7) 
其 次 求 x C(t) 的 方差 阵 。 因 为 式 (9-1) 的 解 为 
zi) 一 多 (esto)xot| B (GW dr (9-8) 


所 以 由 式 (9-8) 减 去 式 (9-7) ,再 右 乘 wT(t) 可 得 
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[x — EfxG) | w(t)=® (GG,io) (xo—mo wT (D+| BD TIGCTIW TW (dr 


上 式 两 端 取 数 学 期 望 ,并 代入 式 (9-5) 和 式 (9-4), 可 得 
Covlx() (DO] 一 | BD (tr)CCr)OCr)OCr 一 上 dr 一 FG()Qot) (9-9) 


将 式 (9-1) 与 式 (9-6) 相 减 ,再 右 弱 [Lx(z) 一 ELxC)j]」 , 则 得 
$x) — Elx()]] | [xc 一 五 Lx(t)]] 
=FCOLxC)— ELxC) Lx) — ELxC))) +GO Ew — ELxC) JJLx(bD 一 巨 Lx(Gt) 了 
将 上 式 转 置 后 再 加 到 上 式 中 ,得 到 
(Lx (0) — ELx C0) JILx 0) — ECxC) I) 


=F(OLxCG)— ElxC) x) — ELxCG) + Ex GG) — EfxG) xG)— EfxG) I TFT) 
GOwA Lx) — ELxG) Lx) — EfxG) | ]w' (GT CG) 
上 式 两 端 取 数学 期 望 , 并 代入 式 (9-9), 得 x() 的 方差 阵 


Varl x(#) |= P.,() (9-10) 
其 应 满足 的 矩阵 微分 方程 为 
已 (一 下 (PC 十 已 (CE (HG Oo) GT UH) (9_11) 
P(to) = Po 
再 次 , 求 x(1) 的 协 方差 阵 
Cov[x(2) ,xC(r) =E{[xCG) ~— ExC() [x(r)— Efx(r) 1]’) (9-12) 


将 式 (9-8) 与 式 (9-7) 相 减 , 令 1 二 i 十 r,to=t, 且 令 原 式 中 r= , 代 换 后 得 
X(t)—ELxCGt+r) =® G+r,) Lx) — ELx()]) 


+| @ Gr GU we dr (9-13) 


式 (9-13) 右 乘 Lx() 一 居 [CxG)] 开 ,并 取 数 学 期 望 ,得 
Covl xC(t+r) x(t) j 一 入 (十 rt 已. (1 


二 | Br Gu Ew ) Lx) — Er) Tdr 
因为 w(G) 为 日 噪声 , 当 r>0 时 
Elwlt)[xCG)—ELxCG)]1]}=0 
且 当 r=0 时 ,积分 上 限 与 下 限 相 等 ,积分 项 为 零 , 故 有 : 
P(t+r,t)=® G+r,i)P(), VY rt>0 (9-14) 
供 据 协 方差 矩阵 性 质 
P(t ,tir) = Pil(Gr,t) (9-15) 
因此 , 式 (9-14) 也 可 写 为 / 
P(t,t+r)=P.()B' (tr,t), VY rt>0 《9-16 ) 
最 后 , 求 x() 与 w() 的 协 方差 阵 。 以 w (2)G () 右 乘 式 (9-13), 并 取 数 学 期 望 , 即 可 得 
到 下 式 , 并 列 人 式 (9- 9) 结 果 
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下 (十 rz 站 GOCIG (1)， 当 7>0 


Pd 十 riD0G7GD) 一 1 三 G(DQu(D)GTC)， 当 r 一 0 
0 ， 当 r<<0 
于 是 ,x( 十 rt) 与 w(t) 的 协 方差 阵 为 
(8B (rt)G(G)O()， 当 r>>0 
Palt+ rst) =—1 G0), 当 r=0 
0， 当 r<<0 


上 述 论证 ,可 以 归纳 为 如 下 和 定理 。 
定理 9-1 设 x() 是 随机 微分 方程 
Xi) 一 下 Ci 二 CCEDJWCE)， xlto)=xo 

的 解 。 其 中 mb 是 均值 为 雯 ,方差 阵 为 CQo( 世 的 日 噪声 ,xy 性 与 w(t) 不 相关 的 nn 
机 向 量 , 其 均值 为 mo 方差 阵 为 P,。。 则 

CD x(?) 的 均 什 为 式 (9-7) ,满足 矩阵 微分 方程 (9-6)。 

(2 x (2) 的 方差 阵 是 矩阵 微分 方程 (9-11) 的 解 。 

@ x(2) 的 协 方差 阵 如 式 (9-14) 或 式 (9-16) 所 示 ， 

(4) x(i 十 7) 与 w(2) 的 协 方差 阵 如 式 (9-17) 所 示 。 

当 式 (9-1) 定 常 时 ,F.G 和 @. 为 常 阵 ,转移 矩阵 

@ (tr,t) = (r)=er 0) 
可 以 证 明 , 当 tt 一 ce 时 ,方差 阵 P,(4) 趋 于 常 阵 P,.。 于 是 , 式 (9-11) 演 变 为 
FP,+PxF' +GQ.G'=0 
定理 9-2 设 x(i) 是 定常 随机 微分 方程 
T(t)—=Fx(t)+Gw(t), xlto)=xo 

的 解 。 假 设 同 定理 9-1, 但 FG 和 ,为 常 阵 , 则 

(CD x(《7) 的 均值 

ElxCQ) |=® (r)mo 

满足 下 列 齐 次 矩阵 微分 方程 


CLExC)]=FELx()], ELx(t0) |=—mo 


Go x(t) 的 方差 阵 P, 是 下 列 和 矩阵 代数 方程 的 解 
FP.+P.F'+GOQG'=0 
(3) x (1) 的 协 方差 阵 
P(t)=@® (r)P,, VY rr 二 0 
或 者 
P.(—rt)=P,.®@ (r), Vv rt 守 0 
@ x(2) 与 w(1) 的 协 方差 阵 


(9-17) 


维 初始 随 


(9-18) 


(9-19) 


(9-20) 


(9-21) 


(9-22) 


(9-23) 


(9-24) 


(9-25) 
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9 (T)GO,, 当 tr >0 
P(r)= GQ,, 当 r=0 (9-26) 


0 ， 当 r<<0 
9. 1.2 状态 对 有 色 了 噪声 的 响应 


在 许多 工程 问题 中 ,随机 干扰 不 是 白 噪 声 , 而 是 有 色 噪 声 。 知 将 电 噪 声 通过 成 形 滤波 
器 , 则 其 输出 便 是 有 色 哄 声 。 成 形 滤波 侣 的 方程 为 
V(t)—=C() zt) (9-27) 
z(t)=A(t)z(t) + BG wt) (9-28) 
式 中 ”9 为 有 色 噪 声 ,w (为 日 噪声 。 
在 有 色 品 声 作 用 下 ,系统 的 随机 微分 方程 表达 式 为 
Tt) =FX) TG) (9-29) 
将 式 (9-27) 代 人 式 (9-29), 则 系统 与 成 形 滤波 器 方程 为 
大 (一 下 (tt 十 CGICCEDIZCE) 
z(t)—=ACG)zG) + BG)w) 


利用 扩充 状态 变量 法 , 令 
FU) GC 
x()=| 7 |， FC)=| 人 2) “| G0)=| 9 | 
z(t) 0 A(z) B() 
则 增 广 系 统 的 随机 微分 方程 为 
x =FOXG) HG Ww) (9-30) 


于 是 ,系统 在 有 色 噪 声 作 用 下 的 啊 应 ,可 以 转化 为 增 广 系统 在 白 品 声 作 用 下 的 响应 。 
9.1.3 随机 型 性 能 指标 


设 随机 系统 微分 方程 如 式 (9-1) 所 示 , 已 知 随机 初 态 xz 的 均值 为 mo 方差 阵 为 Pu 。 若 
取 性 能 指标 


J 三 记 xT(ty)Prx(t/) 十 二 | TyT OO xd (9-31) 


式 中 Pr 为 非 希 定 对 称 和 矩阵 ,0() 也 是 非 负 定 对 称 时 变 和 矩阵 ,。 则 因 x() 为 随机 向 量 , 使 得 J 
成 为 随机 变量 。 因 此 ,在 随机 控制 中 ,应 取 式 (9-31) 的 数学 期 望 作为 性 能 指标 , 即 
7 一 E{ Fx (DPC t+) 2rCOQCOxGDd (9-32) 
为 了 便于 使 用 ,需要 将 式 (9-32) 转 化 为 另 一 种 形式 。 考虑 到 tr[xx |=x'x, 则 式 
(9-32) 在 mo 二 0 时 可 以 写 为 
J =u (ZPDPrt3)| PQ d| 


=Ft{P DPrt| (PQ +ELP A PETA) — [PGP PP))) 


一 Ftr{PoP (to) 二 | Lp. +P. P(E) P,P) ]dt) (9-33) 
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下 面 分 几 种 情况 对 性 能 指标 (9-33) 的 最 后 形式 进行 讨论 。 
(1) 随机 初 态 x 的 均值 天 (xzo) 一 mo 一 0 
将 式 (9-11) 代 入 式 (9-33), 可 得 


JJ 一 Ftr {PoP (to) 十 | [Pen PPO) EFC)P, (PO) 


PF (PO) GG OG GPG) Jdt) (9-34) 


鉴于 当 MM 与 N 为 维 数 相同 的 方 阵 时 ,有 
tr(MN)=tr(NM) 


故 式 (9-34) 可 以 写 为 
J=3tr{PPUDd +t) (POLPO HPOF HE PE) 十 0Q0Q) 


2 
G0000)G (GPG)dt) (9-35) 
右 PC) 满 足以 下 矩阵 微分 方程 及 末 值 条 件 ， 
—P0)=PO FG) +HF (CD) 忆 CD) 十 CC) (9-36 
P(t/)=Pr z 
则 随机 型 性 能 指标 为 
=Z 0{PP() +]| GQ GT Pd) (9-37) 


(2) 随机 初 态 Xo 的 均值 Elxo}=mo0 
定义 ELxoxo 二 P(to) 为 原点 二 次 矩阵。 当 mo 二 0 时 ,P(to) 正 好 等 于 Xo 的 方差 阵 Po。 


不 难 求 得 
J=3tr (PP) +| GQ GT Pa dt) (9-38) 
因为 
=E{(xo—1mo0) (xo— mo.)') 
=E[xoxo |—moEkLxi |— —ELxo jmo 十 imomo 
所 以 
P'(t,)=P,+ mom! (9-39) 
tr {Pr (£0) P(E0)}=tr {mom P(t) PP(,)) (9-40) 
于 是 ,随机 型 性 能 指标 (9-38) 可 表示 为 
J 二 mIP(to)mo 十 让 到 rtPoPdo) 十 | GW Pa (9-41) 


式 中 pdu) 满 足 矩 阵 方程 (9- 36)。 
(3) 系统 (9-1) 及 初 态 xo 均 为 确定 性 的 
因 w(i) 一 0,xo 二 Elxo) 二 Ho, 故 0o(1) 二 0,P, 一 0。 确 定性 系统 方程 


T(t)—=ACXCG), xlto)=xo (9-42) 
确定 性 性 能 指标 由 式 (9-41) 可 以 求 出 为 
J=5xP (x (9-43) 
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正好 还 原 为 确定 性 系统 的 最 优 性 能 指标 。 

(4) 系统 (9-1) 无 模型 品 声 ,但 初 态 为 随机 过 程 

因 wQ) 二 0, 从 而 0, 习 一 0。 在 E{xo}= 王 mo 关 0 且 xo 的 方差 阵 为 Pu 时 ,性 能 指标 (9- 
41 ) 演 化 为 


J= FmPlio mot Ftr (PP,)) (9-44) 


去 (9-44) 中 第 一 项 是 由 于 随机 初始 状态 产生 的 附加 量 。 显 然 , 性 能 指标 (9-41) 中 的 积分 
项 ,是 由 于 作用 在 系统 上 的 随机 干扰 过 程 产生 的 。 因 为 Qu(z) 和 PQ) 都 是 非 负 定 矩 阵 , 因 
而 可 以 得 出 结论 :随机 控制 系统 的 性 能 指标 总 是 大 于 其 相应 的 确定 性 系统 的 性 能 指标 。 


9.2 ”随机 状态 反馈 调节 器 


9.2.1 随机 最 优 状 态 调 忆 器 


问题 9-1 设 线性 时 变 随 机 系统 方程 
TH) = FX HGAu Hw) 
X(to) 一 Xo 《9-45 ) 
式 中 x(1) 为 n 维 状态 向 量 ,wu(i) 为 m 维 控制 向 量 ,w() 为 二 维 零 均 值 高 斯 白 品 声 ,x 为 
维 随 机 初始 状态 。 已 知 
E{xo}=mo, 歼 {(xzo 一 mo)(xzo 一 mo)T} 一 已 
E{xow (2)}=0, Ef{w(l)w'())=0,0) 
要 求 随机 最 优 控 制 wu* (2) ,使 下 列 随机 二 次 型 性 能 指标 ，; 


J=F FxT (Prx (i)) +3| ExT WO)x0) +u (RO uC) ld (9-46) 


最 小 。 式 中 Pr 与 QQ) 为 对 称 非 负 定 和 矩阵 ,RG) 为 对 称 正定 矩阵 ,tj 固定 ， 
为 了 求解 问题 9-1, 需 要 证 明 一 个 确定 性 系统 的 预备 定理 。 设 确定 性 系统 方程 为 


X(t)—ACGxXC(H TFBOu), x(to)=xo (9-47) 
性 能 指标 取 为 
=F Pr() +t) [x Or) HuT RO dt (9-48) 
各 采用 某 一 确定 性 的 控制 规律 
u(t)=— RGDr() (9-49) 
式 .中 K (4) 为 任意 选 定 的 时 间 函 数 和 矩阵 , 则 系统 方程 (9-47) 变 为 
Tt)—= ACG)~—BOORG) rx), x(t,)=x, (9-50) 
而 性 能 指标 (9-48) 变 为 
J= 3 DPD + S|) x LOW HR ROR lr)d (9-51) 


可 以 看 出 , 式 (9-50) 与 式 (9-42) 形 式 相同 , 式 (9-51) 与 式 (9-32) 的 确定 性 形式 相同 。 因 此 ， 
由 式 (9-43) 得 系统 (9-47) 在 控制 律 (9-49) 作 用 下 的 性 能 指标 
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T= LIP )x, (9-52) 


2 
式 中 (7) 满足 如 下 矩阵 微分 方程 ， 
—PG)=POLAG)— BOOKRG) JHEAG) — BORG) TPG) 
O02) + RT ROKR GG) (9-53) 
Pli/)=F 
若 采 用 最 优 控制 规律 
MK (ft)=—K() x(t) (9-54) 
式 中 z 
KG)=R GB (PG) (9-55) 
而 PG) 满足 以 下 歼 卡 提 和 矩阵 微分 方程 : 
—P()=P(ACG HATIPO— POOBOR I BYPU) HOG (9se) 
P(t/)=F 
则 最 优 性 能 指标 
J = xIP (x (9-57) 
J * <<] (9-58) 
P(t)<P() (9-59) 
仅 当 GQ) 二 R71G)BTGQ)PBC() 时 , 式 (9-58) 和 式 (9-59) 才 取 严 格 等 号 。 上 述 结论 可 归纳 为 
如 下 预备 定理 。 


定理 9-3 次 矩阵 微分 方程 及 边界 条 件 为 


—P()=POLAG) — BOKRG) HLAG) — BOOKROG TPG) 
Ri()RGRG) HOU) 
/ Plt/)=F 
为 一 矩阵 微分 方程 及 边界 条 件 为 
—P()=P(G)AG) HA CPG)—POBGRT GBT PG) HOUu) 
PU/)=F 
式 中 ,FF 之 0,QG() 之 0,R(z)0,K() 是 任意 连续 的 时 间 函 数 入 阵 ,to 志 1 过 ty。 则 如 下 关系 式 
成 立 : 
PW)SPC) 
仪 当 尺 () 一 R71GQ)BTGQ)PG) 时 ,上 式 取 严格 等 号 ， 
根据 上 述 定理 ,可 以 研究 问题 9-1 的 求解 过 程 。 对 于 系统 (9-45), 取 任 一 线性 反馈 控 
制 律 


u(t)=—R() x) (9-60) 
则 闭环 系统 方程 为 
X(t)=[FG)—GORG) ] 人) 十 让 人) (9-61) 
X(to) = Xo 
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性 能 指标 (9-46) 可 以 写 为 
7 一 已 (六 crCDPrr(D 十 二 | x LO HR ROR rd (9_62) 


则 由 式 (9-41) 知 , 式 (9-62) 可 进一步 表示 为 


/一 miPlto) mo tr {PB (i,) +| cooo。 (PC di) (9-63) 


式 中 PQ) 满足 下 列 和 矩阵 微分 方程 及 边界 条 件 ; 
PBLFG GOR FIFA — GOROA TP) 


+RTCRCGORG) OU) 
Pli/)= Pr (9-64) 
如 果 对 于 系统 (9-45) 选 取 以 下 控制 律 ， 
u* (1)=—K(x() (9-65) 
式 中 

K()=R (GT GPG) : (9-66) 

同样 根据 式 (9-41) 知 ,系统 的 性 能 指标 为 
J= mp mt tr (PAP) + | Qo Pd (9-67) 


式 中 PC 满足 下 列 矩 阵 黎 卡 提 方 程 及 边界 条 件 : 
PQ)=POOFOFEF PG) —PO)GOORT GGT UP) HOU) (9-68) 
Pl(#/)=Pr 
根据 定理 9-3, 有 
P(t)SP() 
仅 当 上 GQ) 二 R71G)GTC()PB() 时 ,以 上 不 等 式 才 变 为 等 式 。 因此, 式 (9-67) 为 最 优 性 能 指 
标 , 相 应 的 控制 律 (9-65) 为 最 优 控 制 律 。 上 述 结 论 ,可 以 归纳 为 如 下 定理 。 
定理 9-4 随机 状态 调节 器 问题 9-1 的 最 优 控 制 律 为 式 (9-65) ,最 优 性 能 指标 为 式 
(9-67)。 其 中 ,状态 反馈 增益 阵 辩 ( 世 定 义 为 式 (9-66) ,矩阵 P(G) 满 足 黎 卡 提 和 矩阵 微分 方程 
友 边 界 条 件 (9-68)。 
定理 9-4 表明 ,随机 型 系统 的 最 优 控 制 律 与 相应 的 确定 型 系统 的 最 优 控制 律 完全 相 
同 。 也 就 是 说 ,确定 随机 最 优 控制 时 ,可 以 完全 不 考虑 模型 噪声 的 存在 。 但 是 ,随机 型 最 优 
性 能 指标 要 大 于 相应 的 确定 型 系统 的 最 优 性 能 指标 .在 随机 最 优 忻 能 指标 (9-67) 中 ,第 一 
项 就 是 相应 确定 型 系统 的 最 优 性 能 指标 ,第 二 项 是 由 于 随机 初 态 通过 初始 方差 阵 P, 而 产 
生 的 ,第 三 项 是 由 于 系统 的 模型 噪声 w(t) 通 过 其 方差 阵 QuG) 所 产生 的 。 由 于 式 中 矩阵 的 
正定 性 或 韭 负 性 ,所 有 的 随机 因素 都 使 随机 系统 的 最 优 性 能 指标 值 增 大 。 


9.2.2 随机 最 优 输 出 调节 器 


如 采 在 系统 的 状态 方程 中 存在 有 色 模 型 噪声 "(i) ,在 输出 方程 中 不 存在 量 测 噪声 , 同 
时 在 系统 的 性 能 指标 中 不 出 现状 态 变量 ,只 出 现 输出 变量 , 则 这 类 问题 称 为 有 色 品 声 作用 
也 的 随机 输出 调节 器 问题 。 

问题 9-2 ” 设 线性 时 变 随 机 系统 的 状态 方程 及 输出 方程 为 
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X(t)—= F(X) TFG u(t) + v(t) (9-69) 
y(00)=H(CDx() (9-70) 
式 中 x(7) 为 n 维 状 态 向 量 ,w(2) 为 m 维 控制 品 量 ,y(z) 为 !/ 维 输 出 向 量 ,y (2) 为 n 维 零 均值 
有 色 噪 声 , 可 视 为 理 噪声 作 用 下 成 型 滤波 秀 输 出 。 已 知 成 形 滤波 璐 方程 为 
V(t)=C()z() (9-71) 
Zz(£) = A(2zE) BWw) (9-72) 
陈 中 mw 为 日 噪声 ,其 方差 阵 为 Qo,(t)。 性 能 指标 取 为 


T=E{3Y DPy CD +) Ly OO Fu ROu) dt) (9-73) 
式 中 Pl 和 QC) 为 对 称 非 负 定 矩 阵 ,RG) 为 对 称 正定 矩阵 。 


要 求 随 机 最 优 控制 & (z) ,使 性 能 指标 (9-73) 极 小 。 
为 了 便于 求解 问题 9-2, 可 用 扩充 变量 法 将 随机 输出 调节 器 问题 转化 为 随机 状态 调 


节 器 问题 。 令 
_ x F(t) CGC) 
i 0], po ee 
Z(t) 0 AQ) (9-74) 
oe G 
GW=| | wD)=| ' | 
0 到 (iD)W LE) 
HCG)=[LH() 0] 
则 增 广 系统 方程 为 
x(0) FX) HO) + wt) (9-75) 
y(t)=HG)xC) (9-76) 


将 输出 方程 (9- 70) 代 人 性 能 指标 (9-73) ,可 得 
J=F FY GPx + | Lx (2)Q Cx + ur Ru) Jdz (9-77) 


式 中 
H (t,)PrH(,) 0 
Pir= 
0 0 
(9-78) 
H'()OGHG) 0 
QO1(7)= 0 0 


由 于 Pz 与 0() 对 称 非 负 定 ， 右 阵 对 (F(t),H(2)} 完 全 可 观测 , 则 由 引 理 6-1 知 , Pir 和 
Q1(2) 为 对 称 非 人 负 定 和 矩阵。 : 
由 系统 方程 (9-75)、(9-76) 及 性 能 指标 (9-77)7 可 以 看 出 ,随机 输出 调节 器 问题 已 转化 
为 随机 状态 调节 器 问题 。 根 据 定理 9-4 可 得 最 优 控制 
u’ (1)—=~—K()x() / (9-79) 
式 中 
K()=R (GG)PG) (9-80) 
而 了 (2) 满 足下 列 歼 卡 提 方 程 及 其 边界 条 件 : 
P=PAOFOFEF PEG) -PAOGOR DIGIPG) OG) (9_81) 
P(tr) 一 Pi7 
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将 矩阵 PG) 及 (1) 按 x() 与 zQ) 的 维 数 进行 分 块 , 即 令 
P(t) | 
Pu(t) P,,(t) 
K(2)=LKiG) K.,()| 


PC)=| 


则 式 (9-79) 可 以 写 为 
8 (1)=—K(t)x(t)—K,(t)z(t) (9-82) 
式 .中 
KC()=R (GG (P00) 
K,(t)=R 1 (GG)P,,() (9-83) 
将 式 (9-74) 及 式 (9-78) 代 人 式 (9-81) ,得 以 下 黎 卡 提 和 矩阵 微分 方程 组 
—P1()=P FOFE (PC) ~—Pu GOR OG TOP) +HT GOGHG) 
PiG/)=H (PrH (ty) (9-84) 
—Pi(t)=P,()AG)++P CG) FT CP,,0) 
— Pn (GG)R (GC)P,() | 
=P,(t)AC)TFLFG) ~—GOK CG) P(t) PG)CG) 
Pi;(t/)=0 (9-85) 
—Ps(t)= P(t)A(1) HAT)P,, (1) + PE, (CU 4+CT HP,, C2) 
—Piz(t)GG)R GG (PG) 


P(t1)=—0 (9-86) 
根据 定理 9-4, 还 可 得 最 优 性 能 指标 z 
J 一 地 mIP(to)mo 十 广 trfPoPCo) 十 | Out)P()dt) (9-87) 
式 中 P() 满 足 式 (9-81) 或 式 (9-84) 一 式 (9-86) ,P(t0) 是 PG) 在 1 二 to 时 的 值 ,而 

mo=E{x(0))= | | I (9-88) 

E{z(0)) 0 

Po =E{[x(t)—mo J[x(t)—mo ]) 

P, 五 人 xD) 一 mo lz' ())} 
-| - | (9-89) 
E{zC() Lx) — mo ]T) E{z(t)z (#)) 
Qo(t) = EWOW OO) = 9 | (9-90) 
0 BG)Q.(t)B (1) 


如 采 z(2) 与 x(t) 不 相关 , 且 z(z) 的 方差 阵 为 A (4) , 则 性 能 指标 (9-87) 可 进一步 写 为 
PP (to0) PoP',, (to) 
A (#0) ap 
tp 0 0 

+] | gy0 gr pr (#) po rp 有 | (9-91) 

以 上 推 证 结果 ,可 以 归纳 为 如 下 定理 。 
定理 9-5 对 于 随机 输出 调节 器 问题 9-2, 如 果 z 的 均值 为 mo, 方 差 阵 为 P,,y (i) 的 
均值 为 零 ,z() 的 方差 阵 为 A (4) 'w(z) 的 均值 为 零 ,方差 阵 为 Qo (2) ,xo 与 w(z) 不 相关 ,x (2) 
写 z() 不 相关 , 且 {F(),HG)} 完 全 可 观 , 则 问题 9-2 的 最 优 控 制 如 式 (9-82) 所 示 , 其 中 
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X(t) 为 系统 状态 方程 (9-69) 的 解 ,z(t) 为 
品 声 系统 (9-72) 的 输出 ,Ki(t) 和 KK;(t) 由 
式 (9-83) 定 义 。 

问题 9-2 的 最 优 性 能 指标 如 式 (9-91) 
所 示 , 其 中 Pt 满足 式 (9-84)， PC) 满 
足 式 (9-85),P2(t) 满 足 式 (9-86) 。 

观察 式 (9-84) 可 以 发 现 , 忆 (Ci) 与 随 
机 干扰 项 完全 不 相关 ,因而 天 (也 与 随 
机 干扰 无 关 。 于 是 ,可 按 确 定型 输出 调节 
髓 方法 求 得 Pi ( 蕊 和 天 ()。 然 后 , 按 式 
(9-85) 求 出 Pia() ,再 由 式 (9-83) 求 出 天， 
(t)。 由 式 (9-85) 有 明显 可 见 ,Pis (i) 与 噪声 
系统 的 参数 有 关 , 从 而 K;(t) 也 与 噪声 系 图 9-1 有 色 噪 声 作 用 下 输出 调节 器 结构 图 
统 的 参数 有 关 。 这 种 特殊 的 结构 形式 如 图 
9-1 所 示 。 


9%.2.3 随机 跟踪 系统 


问题 9-3 已 知 线性 时 变 系 统 的 动态 方程 
天 (一 下 CD) 十 CCEDRECE) (9-92) 
y(t)=H()x() (9-93) 
式 中 xDER ,W(t)ER”,yG()ER', 算 阵 FG)、.GG)、.HG) 维 数 适 当 , 其 各 元 连续 且 有 界 。 
设 ! 维 希 望 输出 向 量 z(t) 是 在 白 噪声 w(z) 作 用 下 ,参考 模型 的 输出 ,已 知 参考 模型 方 
程 为 


X(t)=F, (x(t) Tw) (9-94) 

z(t)=H.,(t)x,(t) (9-95) 
要 求 确定 最 优 控 制 w* (2) ,使 系统 输出 y(t) 跟随 希望 输出 z(z) ,并 使 下 列 随机 型 性 能 指标 
极 小 : 


1=E(3| {Dz TD Ly zu Ru Yd (9-96) 
式 中 末端 时 刻 tj 固定 ,QC) 和 RG) 分 别 为 对 称 非 负 定 和 对 称 正定 矩阵 ,其 名 元 连续 目 
有 界 。 
定理 9-6 对 于 有 限时 间 随 机 跟踪 系统 问题 9-3, 若 阵 对 {F(z) ,HG()}) 完 全 可 观 , 则 最 
优 控 制 
u” (2)—=— KG)xC) KR, x, Ct) / (9-97) 
式 中 反馈 增益 矩阵 
K,(1)=R GG CG)P,, (0) (9-98 ) 
前 馈 增益 矩阵 
Ks(t)=—R- 1C()GT)P,, 0) (9-99) 


而 Pil) 和 Pis(t) 是 与 x(t) 和 x,(i) 维 数 相 应 的 PG) 的 分 块 矩 阵 ,满足 以 下 各 和 矩 阵 微分 方 
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程 及 其 边界 条 件 : 
—P (=PIOOFG) FF OP OG) —P (GOR GG (0)PG) 


+H (0( HG), 
Pl.(t/)=0 (9-100) 
—Pi,(t) = PF,0)+F GP — Pu (GAR (HG (4)Ps(t) 
一 可 QOG)H.,W) 
~—P,(DF,G)+LFG)—GOKRG) ] PC 一 百 (GOGH.,C) 
Pi,(t7)=0 (9-101) 


证 明 采用 扩充 变量 法 , 令 


,01 Fo =[e 0 
0 Fa) 


G(t 
co-[co] wo- 9-109) 
0 wt{z) 
则 式 (9-92) 和 式 (9-94) 可 合 写 为 如 下 状态 方程 ; 
x =FOXH FO) 十 而 (1) (9-103) 
由 式 (9-93) 和 式 (9-95) 知 
y(t)—=y(1)—2z(1) = Hr) (9-104) 
式 中 
HG)=[HG) —H,()| (9-105) 
将 式 (9-104) 代 入 性 能 指标 (9-96), 可 得 
/=+E{| [x0 CX) FuT RC) dz (9-106) 
式 中 
0Q1(1) =H'TG)00HG) (9-107) 


由 于 QG) 对 称 非 负 , 阵 对 [FG() HQ)] 完 全 可 观 , 必 有 0Q1() 为 对 称 非 负 矩阵。 由 系 
统 方程 (9-103)、(9-104) 及 性 能 指标 (9-106) 可 见 , 随 机 跟踪 系统 问题 已 转化 为 随机 状态 


调 广 盘问 题 。 / 
根据 随机 状态 调节 器 的 最 优 控制 律 , 有 
8 (1)=—K(t)xC) (9-108) 
式 中 
K()=R (IC (PQ) / (9-109) 
若 令 
Pult) PP,(t) 
P=| ~. | 
Pis(t) Plt) 


K(i)=[Ki(t) —K,(t) | (9-110) 
则 下; () 满 足 式 (9-98) ,Kt) 满 足 式 (9-99) ,最 优 控制 w* (2) 如 式 (9-97) 所 示 。 
根据 定理 9-4,P() 满 足下 列 黎 卡 提 方 程 及 边界 条 件 ， 
~—PG)=POQ)FG)+F' (PCO) 
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一 PCODGCCD)R (0)G (PC() +O (2) 
P(t/)=0 (9-111) 
将 式 (9-102) . 式 (9-105) 、 式 (9-107) 、 式 (9-110) 代 人 式 (9-111) ,立即 证 得 式 (9-100) 和 
式 (9-101) 。 
观察 式 (9-100) 和 式 (9-98) 可 知 ,Pi() 和 KG) 与 参考 模型 的 参数 无 关 。 随 机 跟踪 系 
统 结构 图 如 图 9-2 所 示 。 / 


wt) 1 O Xi(7) x(I 


十 


”JAD 


mr 一 -wa 


图 9-2 ”随机 跟踪 系统 结构 图 
例 9-1 设 一 阶 系统 方程 


(1)=—z(t) + hult) 


y(t)=zx(t) 
参考 模型 


六 人) 一 一 二 (十 to 人 


Z(t) 一 rt) 


式 中 wm( 世 是 强度 为 gb 的 白 品 声 。 性 能 指标 
J (| {Ey zd P+ Yd 


式 中 rr 二 0。 试 求 该 随机 跟踪 系统 的 最 优 控制 wu* (2)。 
解 ” 根 据 定理 9-6 不 难 求 得 


w* (1) =— FLpnzlt) + pz,(t)] 


当 ty 相当 大 时 ,有 
1 1 及 
Pii ll 了 | 
一 1 
pu=| 工 + 区 
Ur a r 
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9.3 随机 输出 友 馈 调和 大 


对 于 系统 状态 方程 和 量 测 方程 均 含 有 噪声 的 随机 系统 ,如 有 果 通 过 卡尔 曼 滤 波 和 货 , 根 据 
系统 的 确定 性 输入 和 随机 性 输出 得 到 系统 状态 的 线性 最 优 佑 计 , 并 以 估计 状 态 代 奉 系 统 
真实 状态 进行 线性 反馈 控制 , 则 这 种 将 卡尔 曼 滤 波 嚣 和 随机 状态 调节 器 结合 在 一 起 考虑 
的 问题 , 称 为 随机 输出 反馈 调节 器 问题 。 


9.3.1 随机 输出 反 饿 调 记 兹 的 最 优 控制 律 


问题 9-4 已 知 线性 随机 系统 的 状态 方程 及 量 测 方程 为 
Zi 一 FOX 十 GCC 十 WE， x(lto)=xo (9-112) 
y (=HOxC) Hr) (9-113) 
式 中 随机 初始 状态 xz 的 均值 为 mo, 方 差 阵 为 Po;w(z) 与 v(2) 为 零 均 值 白 噪 声 , 其 方差 阵 
分 别 为 非 负 及 正定 的 QC) 和 RoC) ;w(t) 与 v(tz) 不 相关 ;xo 与 w(t) 和 v(2) 均 不 相关 。 其 余 
假设 间 前 。 
要 求 最 优 反 馈 控 制 律 uw* (2) ,使 下 列 性 能 指标 极 小 
J=E Bx DPA CN) +t) Lx" CQ) tu CRC) dt (9-114) 


式 中 Pi 与 0G() 为 对 称 非 负 定 和 矩阵 ;RG) 为 对 称 正定 矩阵。 
根据 分 离 定 理 , 随 机 输出 反馈 调节 器 问题 的 最 优 控制 律 ,就 是 随机 状态 调节 器 的 最 优 
控制 律 ,只 是 以 卡尔 曼 滤波 器 给 出 的 线性 最 小 方差 估计 x() 代 蔡 了 系统 的 真实 状态 x (1)，。 
定理 9-7 线性 连续 随机 系统 分 离 定理 。 
对 于 随机 输出 反馈 调节 器 问题 9-4, 其 最 优 控制 
& (Gt)=—KOxG) . (9-115) 
式 中 状态 反馈 增益 矩阵 
KG)=R GQ)G' GG)PG) (9-116) 
而 Pd) 满足 下列 黎 卡 提 矩 阵 微分 方程 及 其 边界 条 件 ， 
—P()=POFG)+ETGPG)— PG)GO RGT HP() HO0u) 


pu yp, (9-117) 
X(t) 由 以 下 卡尔 曼 滤 波 方程 给 出 : 
x (0) PXTGOUuD TROT HAO] 0118g) 
x(to) = mo 
式 中 卡尔 曼 增 益 矩 阵 
Ki1(t)=P1(t) HT (Rs) (9-119) 


而 Pi (2) 满 足以 下 歼 卡 提 和 矩阵 微分 方程 及 其 初 值 条 件 : 
Pi(2)=F (P(t) +P OFT) — PHT GR OAH GP G4) +O0) (9-120) 
Pi(to)=P, 
随机 输出 反馈 调节 器 的 结构 图 如 图 9-3 所 示 。 


* 310。 


EL 一 一 一 一 一 一 上 一 -一 一 一 一 一 -一 一 一 一 一 一 一 一 -一 -| 


图 9-3 随机 输出 反馈 调节 器 结构 图 


证 朋 ”定义 估计 误差 与 估计 误差 方差 阵 分 别 为 
X(t)—=x(t)—x() (9-121) 
P(t)=E{x() x (t)) (9-122) 
根据 正 交 投影 定理 ,状态 估计 x(2) 与 估计 误差 x() 彼 此 正 交 , 因 此 有 EE{xX "二 EE{XX7) 一 
0。 于 是 z 
E{x OGx}=E{(x—x)'O0) CE 一 无) } 
=E{tr[QG) (x—x) (x—x)") 
=tr{QG)ELECxxX )— ECxx )— ECXx') Ex) |) 
=E{x Q(x) ttr{O0)P, 0)) 
令 tz 二 ty, 则 有 
Et{x (ts)Prx(t/)}=E{x (ti)Prx (tr)) ttr{PrP, (7)) 
将 上 两 式 代 人 性 能 指标 (9-114) ,可 得 


一 5E 局 (£1)Prx ty) | [xTOCGDX 十 TIRCGDz]d: 


+ 到 tr|PrP GD 十 | QP, CDd | (9-123) 


考察 卡尔 曼 滤 波 方程 (9-118) 中 的 估计 量 测 误差 (信息 过 程 ) 
yt)~yG)— HG rx) 
将 量 测 方程 (9-113) 代 人 上 式 , 可 得 
y(t)=—HGXG) rv) 
估计 量 测 误差 的 协 方差 阵 
E{y(2)y (rt)}=E{[—HGXG) Hv [~— HRC) Hy) ]T) 
.311 。 


—HOGOE(xXCX CH) — HOE(x()yY' (r)) 


—E(y()XT CHT) HE{y vr)) (9-124) 
从 滤波 方程 (9-118) 减 去 状态 方程 (9-112), 并 代入 量 测 方 程 (9-113), 可 得 
T=TFO— KH I HK Av) wl) (9-125) 


根据 定理 9-1 
E(x(x (rt)}=® GP (rr), Vi>r 
~ 里 (it,z) 天 CT)RR Cr)， Vi>r 
E{x(t)v' (rzr) ) 一 
0， Y t<rt 
式 中 全 (1,T) 为 式 (9-125) 的 状态 转移 阵 , 将 上 两 式 代入 式 (9-124), 并 代入 卡尔 曼 增益 矩阵 
(9-119) ,得 到 
E{y(D)Yy (TD)}=HOB GDP THT) — HO GK rT) Ror) HR, (1)6(t—7) 
— R(t)d(t— rt) 
由 上 式 可 见 , 估 计量 测 误差 y() 是 方差 阵 为 Ro() 的 白 品 声 。 因此 ,Ki1()y() 也 是 白 噪声 。 
令 日 曝 声 
wi(t)=KiCy()=K DyG)—HG x 
其 统计 特性 
E‘wi(t)}=0 
E{wilt wi (0)}=K,G) RKT) 


因此 滤波 方程 (9-118) 可 以 写 为 


Xt)=FORGH) HG Hw 0) (9-126) 
此 外 ,由 式 (9-123) 可 见 ,其 后 两 项 与 控制 ult) 无 关 。 因此 ,选择 u(t) 使 性 能 指标 (9-123) 极 
小 的 问题 ,等 价 为 选择 xi) ,使 下 列 性 能 指标 


J—1E FDPrEGD)+| [QE+uT Rd (9-127) 


极 小 。 于 是 ,随机 输出 反馈 调节 器 问题 的 提 法 变 为 :根据 滤波 方程 (9-126) ,寻求 最 优 反锁 
控制 律 x (2) ,使 性 能 指标 (9-127) 极 小 ,。 这 正 是 随机 状态 反馈 调节 器 问题 9-1 的 提 法 。 根 
据 定 理 9-4, 随机 状态 调节 器 的 最 优 控制 与 确定 型 相应 状态 调节 器 的 最 优 控制 相同 ,由 
式 (9-115) 至 式 (9-117) 给 出 ,除了 以 状态 估计 x(z) 代 替 状 态 x() 外 ,与 最 优 滤波 器 无 关 ， 
状态 最 优 估 计 x() 由 卡尔 曼 滤 波 公 式 (9-118) 至 式 (9-120) 给 出 ,与 最 优 控制 器 无 关 。 因 
而 ,分 离 定 理 成 立 。 最 优 控制 器 与 最 优 滤波 器 可 以 分 别 单独 设计 。 


9.3.2 随机 输出 反馈 调 忆 器 的 最 优 性 能 指标 


将 最 优 控制 式 (9-115) 代 和 人 状态 方程 (9-112) 及 滤波 方程 (9-118) ,并 考虑 到 量 测 方 
程 (9-113) ,可 得 
(GE)=FGxG)—GOKOxG) +we) (9-128) 


X20)= [FO —GOORGO SK, GG) (HOLxXG)—x0)) v0)} (9-129) 
定义 状态 估计 误差 x()==x() 一 x() ,将 式 (9-129) 减 去 式 (9-128), 得 到 
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X=EFG) — KH T+ KR A) 一 由 () (9-130) 
县 有 
X(t) —— KGHGxC) LEFG) — GOKG) EO) HR, (tv(#) (9-131) 
将 上 两 式 写 为 增 广 矩阵 形式 ,并 在 书写 过 程 中 ,为 方便 起 见 略 去 时 间 z, 得 


x] rF—_KH 0 _1 天 Try 
-| I A] em 
KH F—_GKJLx 0 K,JLy 


行 令 增 广 状 态 方 差 阵 
此 
Pa 一 Var 2] 


设 E{xo) = 二 mo 二 0, 已 证 :卡尔 曼 最 优 估 计 xx* 为 无 偏 估计 , 故 有 {x}=0。 于 是 


Pi P. X] 、 
Pi=| |=a[: | 2 
Pi Py X 
式 中 Pi 二 Pl 一 (xx) ,Pi 二 E{xx' ,Pz 一 E{xx'}。 根 据 状 态 对 白 噪声 的 响应 可 知 ,Pi;; 满 
足 式 (9-11)。 于 是 得 


P=(F—KH)P+P(F—KH)'-O KRKI, P(t)=P, (9-133) 

P= (F—K,H)P,+P(F—GK)'—PH' KiITKRKR, P(to)=0 (9-134) 

P= (F—GK)P;s+ PF—GK)'— PIH Ki—KiHPs+KIRoKT, P(to)=0 
(9-135) 


在 上 述 和 矩阵 微分 方程 组 中 ,代入 式 (9-116) 和 式 (9-119), 并 由 正 交 投影 定理 知 ,Pl,= 
Elxx') 二 0, 于 是 有 
PG)=FG)PG)+P OF GH)—P OH (RG GHG)P (+O,0) 


P(to)=P, (9-136) 
P,,—=[ FO)—GOGORG) IPy G0) POOLFOG)—GOKRG) HR, GR GK CG) 
P,,(to)=0 (9-137) 
式 中 式 (9-136) 就 是 滤波 获 卡 提 方 程 (9-120)。 
由 于 状态 x() 的 方差 阵 为 
P(t)=E{(x—x)(x—x)')=P,,(t)+P, 0) (9-138) 
以 及 由 式 (9-115) 可 得 控制 w(2) 的 方差 阵 为 
P.()=E(u(iu (0)}=K()P,, (KG) (9-139) 


故 性 能 指标 (9-114) 可 以 写 为 
J = | rT GDPrxte) + | Lx QD Hu Ru Jdt| 


一 Ftr [PP +| [WP 二 + RODK ()P,, (KT di | 
在 上 式 中 ,加 上 以 下 便 为 零 的 等 式 ， 


方 LPCo)Ps(to) 一 PrPCGtD] 十 于 | 后 


7 Fz LLP)P() jdt 一 0 
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J = Ftr{Plo) Ps lt) 二 | [QWP,G) + ROK(G)P,, (tt)K:'() 


+ PCG)P,.() +PG)P,G) ldt) 
将 式 (9-117)、 式 (9-136) 一 式 (9-138) 以 及 式 (9-116) 代 和 人 上 式 ,经 整理 得 mo 二 0 时 的 最 优 
性 能 指标 


六 一 3tr {P (#0)P,o 十 | [P00) +K (ORCGOK GCP) jdt) (9-140) 


当 mo 天 0 时 , 依 同 样 推导 方法 可 得 最 优 性 能 指标 


J =BmlPG mt tr (Pu) P+ | [PQ. (2)+K GRCGKG)P, CG) Jdt 


(9-141) 
对 于 确定 型 系统 ,在 性 能 指标 (9-141) 中 , 仅 第 一 项 存在 多 由 于 1o 二 xo， 有 所 得 最 优 性 能 
指标 为 


J = xIP(t x (9-142) 


正好 与 第 5 章 所 得 结果 一 致 。 

对 于 随机 型 系统 ,性 能 指标 (9-141) 中 各 项 都 存在 ,其 中 第 二 项 是 由 随机 初 态 产生 的 ， 
第 三 项 由 系统 模型 噪声 产生 ,最 后 一 项 则 由 估计 状态 所 产生 .以 上 随机 因素 都 增 大 了 最 优 
性 能 指标 的 值 。 


9.3.3 随机 输出 反馈 跟踪 系统 


本 章 第 2 节 研 究 的 随机 跟踪 系统 ,可 以 利用 的 信息 是 全 部 参考 变量 与 状态 变量 .现在 
的 问题 则 是 只 有 部 分 变量 的 线性 组 合 可 以 量 测 , 而 且 在 这 些 信息 上 还 都 附加 有 白 噪声 
问题 9-5 已 知 线性 随机 系统 状态 方程 为 


无 (一 下 (Ci 二 CCD 十 CE) (9-143) 
量 测 方程 为 
y(t)=H()x() v(t) (9-144) 
输出 方程 为 
z(t)=D(t)x(t) (9-145) 
式 中 z(i) 为 g 维 输出 向 量 ， 
这 9 维 参考 向 量 z(t) 是 参考 模型 在 白 噪声 作用 下 的 输出 。 已 知 参考 模型 状态 方程 为 
E(t) =F, x,t) +w, Ct) (9-146) 
式 中 w,(2) 是 均值 为 零 . 方 差 阵 为 0,(2) 的 白 曲 声 。 参 考 模 型 的 量 测 方程 为 
yr-(t) = H(t)x,(t) yr, (#) (9-147) 
参考 模型 的 输出 方程 为 
z(t) = D, (x,(t) (9-148) 
要 求 确定 线性 最 优 反 馈 控 制 u* (2) ,使 系统 输出 z() 跟 踪 参 考 输出 z,() ,并 使 下 列 随 


机 型 性 能 指标 极 小 、 
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J=E|3| {Le -6 TO LD sD) I Ru dt (9-149) 


式 中 末端 时 刻 z 固定 ,0G) 和 和 RG) 分 别 为 对 称 非 久 定 和 对 称 正 定 和 矩阵 。 
定理 9-8 对 于 随机 输出 反馈 跟踪 系统 问题 9-5, 若 系统 {F(t),DG)}) 完 全 可 观 , 参 考 
模型 {F,G),D,()}) 完 全 可 观 , 则 最 优 控 制 


u* (1) = — KGx(t) + KR, Cx,() (9-150) 

式 中 
Ki() = RGTH) PC) (9-151) 
K,(t)=—R (GH)P,0) (9-152) 


而 PC) 及 Pizs(2) 分 别 满足 以 下 和 矩阵 微分 方程 及 其 边界 条 件 : 
~—Pn(t)=Pn DFE (P10 —PI (GOOR GG PG) +DT HOUG DC) 
P(t;)=0 (9-153) 
~—Piz(t)= PC)F, (D+F (Pt) — PNGOR (GT) P(t) — DT (OU D,0) 
Pi,(t/)=0 (9-154) 
且 有 
— P22 Ct)= Ps FHF GG) P20) — PEOGOOR GGTHu)P,, 0) 
十 万 (1)QC()D, 0) 
P,,(t/)=0 (9-155) 
式 (9-150) 中 的 *(G) 为 系统 模型 的 卡尔 曼 滤 波 器 的 输出 ， 而 二 (2) 则 是 参考 模型 的 卡尔 曼 
滤波 需 的 输出 。 
证 明 利用 扩充 变量 法 ,可 将 系统 模型 (9-143) ~ (9-145) 与 参考 模型 (9-146) ~ 
(9-148) 合 成 一 个 增 广 系 统 , 其 状态 方程 


X(t)=FOXG) HG uD) HW) : (9-156) 
式 中 
F 
x)=| | FD=| 0) 9 | 
x, (1) 0 F(t) (9 ) 
-157 
G 
GD)=| “| w= 
0 w,(t) 
增 广 量 测 方程 为 
y0) =HGrG) rv) (9-158) 
式 中 
y(t) _ v(t) 
oO op 
> ,(£) 人 DP (1) 
To 0 (9-159) 
H(i)= | 
: 0 —H.,() 
增 广 输出 方程 为 
z(t)=DG)xC) : (9-160) 
式 中 


"了 5。 


z(t)=2z(t)—2,(1) (9-161 ) 


DU)=[DG)—D,C)) (9-162) 
将 式 (9-161) 和 (9-160) 代 入 性 能 指标 (9-149), 可 得 
7=E{ 这 | [x OOO Fu Ru de | (9-163) 


式 中 
万 (1)0 (DC) —D' (O00)D,C) 


: —DIi( OWDG) DG)O0()D, G0) 
因为 0(2) 对 称 非 负 定 , 阵 对 [FGQ),DG)j] 及 阵 对 [F(t),D,(4) | 完全 可 观 , 所 以 OG() 为 对 称 
非 负 定 和 矩阵 。 

通过 以 上 变换 ,随机 跟踪 问题 式 (9-156) 和 式 (9-163) 变 为 典型 的 随机 状态 反馈 调节 
器 问题 。 根 据 定理 9-4 


QW=D" WWD =| | (9-164) 


K()=R GG (PG) (9-165) 
今 
Pi CD) P(t) 
Pi,(t) PP 人 
并 将 式 (9-157) 代 人 式 (9-165) ,立即 证 得 式 (9-1517 和 式 (9-152) 。 
将 式 (9-157) 及 式 (9-164) 代 入 P(z) 满 足 的 如 下 歼 卡 提 和 矩阵 微分 方程 及 其 边界 条 件 : 
—PO)=POOFG FF CPG —POGOR YG HPO TOU) 
Plt:)=0 
立即 证 得 式 (9-153) 一 式 (9-155) 。 
由 分 离 定 理 9-7 ,证 得 最 优 控制 律 (9-150) 。 
随机 输出 反馈 跟踪 系统 的 方 框 图 如 图 9-4 所 示 。 


PC)=| | K(t)=[ Ki() —K,0)| 


TT de 


t 
;i (站 
no 


图 9-4 随机 跟踪 系统 方 框图 
由 定理 9-8 可 见 , 求 解 K;(t) 只 需要 确定 模型 系统 的 参数 ,与 参考 模型 无 关 ; 而 求解 
KC) 则 必须 用 到 参考 模型 的 参数 ， 
例 9-2 设 二 维系 统 模型 方程 


i Oi 


TI(L) = x(t) TF we) 
Z(t) =u(t) 
输出 方程 
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2 (zt) 一 .人 (7 ) 
量 测 方程 
yi) 一 IC 十 PC ) 
式 中 (是 均值 为 零 强度 为 gz 的 白 品 声 ,o(i) 是 均值 为 零 .强度 为 六 的 日 噪声 , 妈 () 与 
u(t) 不 相关 。 
设 系 统 应 跟踪 z, (7) ,参考 模型 方程 为 


官 (一 一 一 六 (十 tor() 


Z(t) = x(t) 
参考 模型 量 测 方 程 为 

Y(t) =, (tt) v(t) 
式 中 w,(1) 与 wb 是 均值 为 零 . 互 不 相关 , 且 方 差分 别 为 9 和 p? 的 白 噪声 。 试 求 最 优 控 
制 , 使 下 列 性 能 指标 为 最 小 


1=E(| {ze) —z,(t) ru’(t) dt} 


式 中 zcoa 和 > 都 是 大 于 零 的 常数 。 

解 ” 由 于 系统 模型 和 参考 模型 都 是 定常 的 ,性 能 指标 的 权 系 数 为 常数 , 且 tj 一 0, 因 
此 属于 和 定 遂 随机 跟踪 系统 问题 。 此 时 ,天 和 K; 都 是 常 同 量 或 常数 。 按 确定 型 输出 岩 节 费 
问题 计算 ,不 难 求 得 

Mi y1/2 
P= 

rl/2 V 2 p34 
因而 
Ki=r “iG'P=[r-'? V2r-!] 

下 一 步 求 Ki。 令 Pi 二 [LP Ps], 由 式 (9-101), 考 虑 到 户 , 二 0, 得 如 下 两 个 代数 方程 


P 
+r P+1=0 


PF 
一 一 已 十 人 2 一 14 PP 一 0 


> 一 1 
,一 一 - 一 
ra :二 2a-ir 1 


由 式 (9-152) 得 


rl 


K 一 一 -一 -一 一 
r 12 十 a 十 / oa- ir —1/4 


一 


于 是 ,由 式 (9-150) 得 最 优 控制 
rr 


2 (=r TF Vr roe (4) 
! < ra ?十 V 2 Qi7 a 


式 中 状态 估计 zi (和 zs) ,以 及 估计 参考 状态 xz; (1), 可 采用 卡尔 最 滤波 理论 算出 。 例 
如 ,xz) 可 由 
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(1) = 一 二 Z,(1) hEy() — i0)] 


we 
9.4 离散 系统 的 随机 最 优 控制 


离散 系统 的 随机 最 优 控 制 结果 ,在 许多 方面 与 连续 系统 的 随机 最 优 控 制 结 采 相 平 行 ， 
因此 有 些 证 明 过 程 我 们 就 省 略 了 。 本 广内 容 的 安排 ,与 连续 系统 的 随机 最 优 控制 问题 基本 
相同 。 


9.4.1 状态 序列 对 日 噪声 的 有 曙 应 


设 线性 离散 随机 系统 的 状态 差分 方程 为 
x(k+1)=® (kT1,k x) HT (kwE) (9-166) 
式 中 x(8) 为 n 维 状态 问 量 ,w(8) 为 m 维 白 品 声 .已 知 x(0) 是 二 维 初 始 随机 状态 向 量 , 与 mw 
(k) 不 相关 ,x(0) 和 wlk) 满 足 高 斯 分 布 ,其 统计 特性 为 
五 | x(0) |= mo 
E{[x(0)—mo [x(0)— mo |)}=P, (9_167) 
E{[w(k)— Ew(lk) Ew 0) —ELwCO)]]})=00)6, 
E{[x(0)—mo [wk)— Elw(k)]]')=0 
将 式 (9-166) 两 端 取 数 学 期 望 , 得 x(%) 均 值 应 满足 的 差分 方程 为 : 
E[x(k+1) |]=® (k++1,k)ELxCk) +T (k)EFw(CE)] (9-168) 
由 式 (9-166) 和 式 (9-168) 可 得 
E{[x(k+1)—ELx(k+1) [x(t+1)—ELx( 二 1)]]") 
=—E{l®@B (kl,k) x(k)— ELxCk) | [xk)— ELxCk)]] ®' (kt1,k) 


算出 。 其 中 


+E{T (kw ek) — ELwCE) wR) — Ew E) TTE)) (9-169) 
夏令 x() 的 方差 阵 为 
P(gk)=E{[x(k)— ELxCk)]][x (Ek)— ELxCk) 1]]) (9-170) 
则 由 式 (9-169) 得 P(&) 应 满足 如 下 差分 方程 : 
POUE+1)=® Ck+IRPOE BT ,EFT (Rk)O RITTE) (9-171) 


应 用 与 连续 随机 系统 类 似 的 方法 ,可 得 如 下 定理 。 

定理 9-9 设 x(%) 是 状态 差分 方程 (9-166) 的 解 ,其 中 w() (二 1,2,…,N 一 1) 是 方 
差 阵 为 0,(8) 的 高 斯 白 噪声 序列 。 已 知 随 机 初始 状态 x(0) 为 高 斯 分 布 ,与 w(4) 不 相关 ,是 
其 均值 为 m, 方 差 阵 为 P,, 则 如 下 结论 成 立 ; 

(DD x(k) 的 均值 满足 差分 方程 (9-168)。 

CO x(k) 的 方差 阵 P(%) 满 足 差分 方程 (9-171)， 

@@ x (4) 的 协 方差 阵 为 , 
P(g jk)=®B (kj,k)P(E), VY ji>0 (9-172) 
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已 (&, 开 十 门 一 忆 (E) (ki,k), VY 7>0 (9-173) 
4) x(k) 与 w(&) 的 协 方差 阵 为 
E{[xCk+7)—E[xC(k+7) wR) — ELw(E))]} 
BD (kj,k 二 1)Q,(8), Jj>0 


(9-174) 
0， J 入 0 
定理 9-10 设 xGR) 是 如 下 定 销 状态 差分 方程 的 解 : 
xX(k 二 1)=B rxr(k)+T wlk) ， (9-175) 
式 中 $ 与 矿 为 常 阵 ,w(%) 的 方差 阵 Qu, 也 是 常 阵 , 其 他 同 定理 9-9。 则 当 &A-~>c=o 时 ,如 下 结论 
成 立 : 
(DD) x(%) 的 均值 
ElxC(k+1)]=® E[x(k)]+T Elw(CE)] (9-176) 
CI x(4) 的 方差 阵 
P~®@BPO -TOT (9-177) 
GB) x(k) 的 协 方差 阵 
P(7))=® (7)P 
或 P(—]7)=P®'()) (9-178) 
@ x(&) 与 w(&) 的 协 方差 阵 
E{[x(k+7))—ELxCR+) wR) — ELw(E) |]'}= ® UTD, >0 (9-179) 


0， Jj 委 0 
9.4.2 离散 随机 状态 反馈 调节 器 


问题 9-6 设 线性 离散 随机 系统 的 状态 方程 
x(k+1)=® (k++1, kx) HB RuE) Hw EE, x(0)=xo (9-180) 
式 中 x(k) 为 n 维 状态 向 量 ,u(&) 为 m 维 控制 向 量 ,w(%) 为 n 维 零 均值 高 斯 白 噪 声 ,其 方差 
阵 为 Qo(%) ,xo 为 随机 初始 状态 高 斯 分 布 , 其 均值 为 mo, 方差 阵 为 Po, 且 与 w(%) 不 相关 。 设 
系统 随机 型 性 能 指标 为 


J 二 5El EOFECN) + TL QR) tur ROYuk)]) (9-181) 


式 中 QO(&) 与 F 为 对 称 非 负 定 矩阵 ,RE) 为 对 称 正定 矩阵 要 求 确 定 线性 最 优 反馈 控制 律 
&” (k),k 二 0,1,2,…,N 一 1, 使 性 能 指标 (9-181) 极 小 。 
定理 9-11 离散 系统 随机 最 优 状态 调节 器 问题 9-6 的 最 优 控 制 序 列 为 


u* (k)=—K(R XR), k=0,1,.…,N—1 (9-182) 
式 中 状态 反馈 增益 矩阵 序列 
: K(k)=[R(E) BT EPCETINBGE) NB TAPARTI SG RHI,k) (9-183) 
而 P(A) 应 满足 以 下 离散 黎 卡 提 差 分 方程 ， 
P&E)=BTR+I RPET IDG (1,k) 
— KT (ELRCGE) HTBT RPCET I BCG) IK Ck) +O) (9-184) 


其 边界 条 件 为 
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P(N)=F (9-185) 
问题 9-6 的 最 优 性 能 指标 


太一 1 


J =FmiP(Omot Ftr{P(O)Po 2 0 4) PCE+1)) (9-186) 


证 了 明 由 哈密 顿 - 雅 可 比方 程 
JEx (Ck) ,人 一 min3 {x CRIOC(RI XE Hu RR WUE) TITLr(C1) ,十 1]) 


(9-187) 
式 (9-187) 两 端 取 数学 期 户 
尼 (J[zCD , 打 ) 一 min 方 尼 (xT(ED)GCEDx(CE) tu RRC uk) 
十 J[xCk 十 1) ,有 十 1]) (9-188) 
A 
J[x(k) ,kJ= [x Ck) P(E) Ck) hk)] (9-189) 


式 中 P(%) 及 h(k) 待 定 。 则 有 
J[xCk+1) ,kt1]= 5[x kt PE+I r+) +h +1)] (9-190) 
将 式 (9-180) 代 人 式 (9-190) ,两 端 取 数学 期 望 ,考虑 到 mw) 与 xGR) 及 2GR) 均 不 相关 ,可 得 
E{J[x Ck+1) ,kt1])=3[® (+1 xR) +B uk) 
POET DEG CH1 LXE HB) 
+ Ft Ck)P (E+1) + Fh(k+1) (9-191) 
将 式 (9-191) 代 入 式 (9-188), 并 通过 配 完全 平方 ,得 
E{J|Lx(k) kJ} =mins (x (k)QUx CR) 十 EC 及 (DC 二 EC(J[xCKk+1),k+1 |)) 


=mins (x(k)[BT Ck+1 ,POE DG (k++1,k) +OC() 


— KTR) (RCGE)+BT RP BE KCE) Ix Ck) 
+ [uCk) RR XE LRCOE)THBT (RPCOER+1) BE) ] [ae(R) 
KCE)xCE) 十 trOu(R)P(R 十 1) 十 RCR 十 1)) (9-192) 
式 中 K(k) 二 [ROGER)BT ROPCETIBGE) IB (RPCETID)G (1,k). 因为 R(k)>O, 
P(k 十 1) 之 0, 故 LR(E) 十 BCk)P(k 十 1)BC(&) | 存在。 
由 式 (9-192) 显 见 , 极 小 值 在 
2 (k)=—K(k)xCE) (9-193) 
时 得 到 。 z 
当 式 (9-193) 成 立时 ,由 式 (9-189) 和 式 (9-192) 可 得 
3 ExT (EPO HAGE) = 5x RB +1 PR+ LG (k++1,k)+QCE) 


—K (Rk)(R(ER)+B (KP(EH1)BCGE))K CR) Ix (Ck) 
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十 二 trOsCDP(E 十 1) 十 可 4 十 1 (9-194 
因此 ,P(&) 满 足 离散 黎 卡 提 方 程 (9-184), 且 有 
hE) hETI) HO RPETI), ACN)—O0 (9-195) 
最 优 性 能 指标 


"=minE{xT CN)FxCN) + SNExT (ROG) x CE Hur CKORCEuE) =E(ILx,,0]) 


N-1 
=5mIP(O mt tr{P(OPo + >) QE)P+1)) 


式 中 第 一 项 是 确定 型 系统 的 性 能 指标 ,第 二 项 是 由 于 随机 初始 状态 产生 的 ,最 后 一 项 则 是 
由 系统 模型 噪声 所 产生 ,与 连续 随机 系统 中 的 分 析 结论 相同 ,所 有 的 随机 因素 都 会 增 大 系 
统 的 性 能 指标 。 


9. 4.3 离散 随机 输出 反馈 调节 器 


现在 研究 不 完全 状态 信息 情况 下 的 离散 随机 输出 反馈 调和 着 设计 :所 研究 的 线性 离 
散 系统 存在 模型 噪声 , 量 测 信 息 不 完全 且 量 测 信 息 上 附加 有 上 品 声 ,初始 状态 为 随机 加 
量 。 
问题 9-7 已 知 线性 离散 随机 系统 的 状态 方程 和 量 测 方程 分 别 为 
Xk 二 1)=B (k+l RXR) TBIRuE) Hw Ek) (9-196) 
z(k)—=H(R)X(R)+v ER) (9-197) 
初始 状态 x 与 白 曝 声 w(%) 及 py() 的 统计 特性 为 
E{xo}=mo, E{xo—mo) (x —m)'}=P, 
E(wlk)}=0, E{wCk)w (k)}=QoCk) 
E{v(k)}=0, E{vy(k)v'T(k)}—= Rk) 
E{xow (k)}=E{xov (k)}=E{(w(k)v' (k)}=0 
式 中 Qo(K) 宇 0,Ro(k) 汪 0。 系 统 随机 性 能 指标 为 


(9-198) 


NO—1 
J=3E{xT NFPACN)+ DLxT (QUA) Hu (ROE)]) 《9-199) 
k=0 


式 中 CD)>0,RGA)>0。 要求 根 据 系统 量 测 输出 zo ;zi,… ,zi ;确定 最 优 控制 wu* (8),k 一 0， 
1,… ,NN 一 1, 使 性 能 指标 (9-199) 极 小 。 
定理 9-12 线性 离散 随机 系统 分 离 原 理 
对 于 离散 随机 输出 反馈 调节 器 问题 9-7, 其 最 优 控制 
u’ (有 ) 一 一 下 (RD)X(R) (9-200) 
式 中 状态 反馈 增益 矩阵 序列 
K(k)=[LRC(E)+TB' (RIPCETIOBCGE)] 'B (Ck)PC(ETI)D (k++1,k) (9-201) 
而 PC(k) 满 足下 列 和 矩阵 差分 方程 及 边界 条 件 、 
P(Ek)=BT(k+1 RP (k++1,k) HOR — KT ERGE) 
+B' (Rk)PC(E+1)BGE) JK(Ck) 
P(N)=F (9-202) 
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式 (9-200) 中 的 x(%) 为 条 件 均值 ,满足 以 下 卡尔 曼 滤波 方程 ; 


f(E) 一 过 (有 |R 一 1) 十 开 ' RR — HE rE CO— 1)1] (9-203 ) 
X( 有 | 有 一 1) 一 (一 1)7(R 一 1) 十 如 (一 1)2(R 一 1) (9-204) 
K'(k)=P(ER|IE—1)HT (RL HPOEIR—1H (R) 十 民 (CR) 一 (9-205 ) 
忆 (R 十 1 有 ) 一 征 (kl RPOEIE®D (kl1,k)+O Ck) (9-206 ) 
P(Ek|Ek)=P(R|k—1)—PR|IR—1)H' (ELH(E) PEIE—1)H' (k) 

RoCk)] ‘HOE)PCE|R— 1) (9-207) 

最 优 性 能 指标 z 
入 一 1 
J*=5miP(O) m+ str{(FP(N)+ Dy [P+1)Q Ck +O Pl4—1)]) 


(9-208) 
系统 的 方 框图 如 图 9-5 所 示 。 


图 9-5 离散 随机 输出 反馈 调节 器 方 框图 


证 明 将 回 题 的 讨论 分 为 两 步 。 
(1) 假定 状态 变量 x(%) 都 可 直接 得 到 
此 时 , 量 测 方程 中 及 (4) 二 1,v(%) 二 0, 即 有 
z(k)=x(k) (9-209) 
问题 9-7 可 看 作 初 值 为 x(0) 的 NN 级 决策 过 程 , 可 用 动态 规划 法 确定 最 优 控制 序列 
u(0),u(1),…,u(N 一 1), 使 性 能 指标 (9-199) 极 小 。 
由 于 初始 状态 x(0) 是 随机 变量 ,其 可 能 值 很 多 ,这 里 假定 x(0) 为 初始 状态 变量 的 取 
值 。 性 能 指标 的 极 小 值 可 用 下 式 表示 ， 
W[x(0)]= min [x™(0)Q(0)x(0)+uT (0)RCO) uCO) 
本 2 Lx" FQ CR) tu (BROCE)] 


+xTCN)PxCN)) |x(0)) | / (9-210) 


式 中国 为 已 设 x(0) 是 状态 变量 初 值 的 取 值 ,所 以 x (0)Q@(0)x(C(0) 和 ww (0)R(0)wu(0) 也 是 
取 值 ,不 需要 取 数 学 期 望 值 。 

根据 动态 规划 最 优 性 原理 ,从 第 十 1 级 过 程 到 第 N 级 过 程 应 当 构成 最 优 过 程 。 设 第 
& 十 1 级 过 程 的 初 值 x(%) 已 给 出 , 则 从 第 十 1 级 到 第 NN 级 的 性 能 指标 极 小 值 为 


W[x(&)J=min ,min | xT (RQ x CR) HuT Ck RCE uk) 


(点 】 下 《 雪 十 1) "HH 


人 | by [x COCOXCO) Hu CROC)] 


区 (二 十 1 TC) 
LD PEN)) 中 p=0,1,.…,N—1 
上 式 可 写 为 
W[x Ck) J=min|[ x (k)Q x Ch) +uT (ROE) 
各 一 1 
(( >，[xTCDQCDx(E) 


mln 
中 (下 十 1] 7) 一 1)》 xtk+1), xtN) j 二 十 1 
tu (PRU TAT NIFxCN)) xzCb | 
耕 x(k 十 1) 为 取 值 ,上 式 可 进一步 表示 为 
0 
: T 
< (a Min, , i piE POO xO) 
tu CDROOTxXT NIFxCN)) |x Ck+1) ||xCp)}}| C9-211) 
在 式 (9-211) 中 ,因为 


N—1 


， T/.， 。 ， T/,， 。 。 工 
et XC) [人 2 [Lx (QP) ta DRODu D+x (N)Ex(N)) rk+1) 
一 [GF DOGE DG DT DR DD) 


uct 


rk 2) ,xCN) | | 3 mon) 


tu COROOuD THTxT NIFxCN)) [x (8+1)) | 
=W[x(% 二 1)] (9-212) 
故 式 (9-211) 可 以 表示 为 
W[x(k)J=min{ (ORE Fr CRO) 
十 到 [xz(& 十 1)]|z(&) }} (9-213) 


显然 , 式 (9-213) 是 动态 规划 的 基本 递 推 关 系 式 ,计算 顺序 从 第 N 级 开始 ,一 直 算 到 

第 1 级 为 止 。 当 =N 时 , 式 (9-213) 变 成 
W[xCN)]=x'(N)FxCN) (9-214) 
式 (9-214) 表 明 ,W[Lx(N)] 是 x(N) 的 二 次 型 函数 。 所 以 ,第 NN 一 1 级 的 WW[x(N 一 1)] 必 是 
X(N 一 1) 和 w(N 一 1) 的 二 次 型 函数 。 以 此 类 推 ,第 级 的 W[x(8)] 应 是 x(%) 和 wu(%) 的 二 

次 型 函数 。 假 定 
HLx(R) 一 xz (RPRED)XZCE) 十 7(R) (9-215) 
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式 中 PC() 为 nXn 对 称 失 阵 ,7() 为 一 标量 , 则 递 推 关系 式 (9-213) 可 以 写 为 
WLx(k) =min{x (RQ XE) tu CRORE uCE) 
上 


+ E {[x (RE 二 1)P(R 十 1)X(R 十 1) 十 7 十 1)]jx(RD) ) (9-216) 
rlk+1) 


由 于 状态 方程 表达 式 为 (9-196), 所 以 式 (9-216) 中 
E {Lx (+1)PETLDr(E+1) IR+1) J |x(E))} 


一 忆 [1B RFI ROKR) TBE UR Hw ERE) PCRIDL® C1,k)xCE) 
入 (上 足 】 


BEMUCR) HT wRE) | 十 7 十 1) |x CR)] 
=[@®B (k+l RXR BARuER) PECINTG (k+l,k)xCk) 
+B(EuUE) ELw CRPCET I wRE) 十 7(E 十 1 ) 
=—[@® (k++1k)xXCE) HB EUR PEEING (1 ,kxCE) 
二 BER)wuCE) trLP(R 二 1)O0. (8) 十 7(E 十 1) (9-217) 
将 上 式 代 入 式 (9-216), 可 得 
WLx Ck) J=min{x (RQ rR) Hu (RRC uCE) 


+ [BB (kl, RXR HBRuE) | PERITG Ck-1,k)xCk) 
十 如 (RE)RCR)] 十 tr[LP(CRE 十 1)OCED) 十 IC 十 1)) 
=min{x' (A)[QC(R)+B (十 1 有 ) 忆 (十 1) 钱 (k++1,k) jxCk) 


十 下 (k)B' (Rk)PC(ET1I)G® (k++1,k)xCE) 
+x (kB R11, RIPE BE uCE) 
Tu (kLROGE)TBT EPOE+1)BGE) Iulk) 
十 trLP(CR 二 1)O (ED) | 十 nC 十 1)) (9-218) 
在 趟 (9-218) 中 ,trLPC( 十 1)Qo(%)j 是 模型 方程 中 的 白 噪声 w(%) 所 引起 的 附加 项 。 根 
据 式 (9-218),W[Lx() ] 应 满足 下 式 ， 
W[xC(k)]=xT Ck)PCE xX) nk) 
=x (kLQOC(R) HBC, LPETIND (k++1,k) IxCk) 
TuT (ROBT RPE (k++1, kx) 
x (RB RI RP BE uCE) 
+u (k)LROE)TBT (EPE BE) lulCk) 
二 trLP(k 二 1)Q0 Ck) |] 十 7 十 1) (9-219) 
求 式 (9-219) 对 ul(%) 的 偏 导数 ,并 令 偏 导 数 等 于 零 , 可 得 最 优 控 制 
LU (k)=—|[ R(TB (RPETIBGE)] iBT (RPOE+FIDG (EH1, kx) 
= —K(k)x(k) (9-220) 
式 中 
K(k)=[L RO(E)TB CRIPCEFIOBGE)] IBT CRPCETIB (RH+1R) (92291) 
在 式 (9-221) 中 , 因 R(k) 之 0,P(k 十 1) 宇 0, 故 逆 和 矩阵 [RCE) 十 BT(k)P(k 十 1)B(&)]-! 是 存 
在 的 。 
企 最 优 控制 表达 式 (9-220) 中 ,P(k 十 1) 为 未 知 矩 阵 。 为 了 求 出 PC 十 1) 的 递 推 关系 ， 
将 式 (9-220) 代 人 式 (9-219) ,经 整理 后 可 得 
x (R)P(E)X(E) 十 7(R) = x CR) (BEI RIPERTHIDG (k++1,k) OR) 
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— KT(k)T ROGETB (RPOE+1)BCOE) 天 (RE)) (RE) 
十 trLP(k 二 1)OQo (Rk) 十 7 十 1 ) 
上 式 对 任意 Y(&) 均 应 成 立 , 因 此 得 
忆 (E) 一 全 TCR 十 1 有)P(E 十 1) 男 (十 1,A) 十 OCR) 
—KT™(RLRCGE) HBT EP BGE) TK CE) 
P(N)=F (9-222) 
以 及 
nk)=trL P(E 二 1)OQ0 (Ck) 十 7(R 十 1) (9-223) 
7(N)=0 
因为 x(%) 是 随机 的 ,所 以 WLxC(%) 和 Wl[Lx(0) jj 都 是 随机 的 , 故 最 小 性 能 指标 旺 数 


J = E{W[x(0)]) 
NC—1 
] 


= FmiP(O) mt 3tr{PCO) Po 2 Pk+1)Q, Ck)) (9-224) 


由 于 离散 矩阵 歼 卡 提 方 程 (9-222) 与 随机 干扰 w(%) 无 关 , 因 此 最 优 反 馈 增 益 阵 KC) 
与 随机 干扰 无 关 。 这 一 特性 很 重要 ， 
(2) 假定 状态 变量 x(%) 需 通过 观测 系统 间接 获得 
已 知 量 测 方 程 (9-197) 
z(k)—=H(E)x(E)+v(E) 
应 用 卡尔 曼 滤 波 方法 可 得 x(%) 的 线性 最 小 方差 估计 


z LCR ECRIE 1) 
可 以 证 明 , 以 x(%) 代 震 x(%) 得 到 的 最 优 控 制 (9-200) ,能 使 性 能 指标 极 小 。 


def .~ 


利用 最 优 估 值 x(%) 与 估 值 误差 XY(%) 一 x(%|% 一 1) 的 正 交 关 系 , 有 
Efx(k)x'(k)1=0 
由 于 
E{x (Rk)Q(R)xCR)}=E{(LxCR) x) | OR) LXER) rE) |) 
=E[x'(k)QC(E) XR) HELXT KO NCE)] 
以 及 
E{x' CN)FxCN)}=E[xTCN)Fx CN) HELXT CN)FXCN)) 
于 是 ,性 能 指标 (9-199) 可 以 改写 为 


N—1 


J=BE(E(N)PECN)+ 2 [2T (RQ ER) 


TET AROAR)]} + SE {XN)EECN) 
N—1 
+ DTT (RQ ER) ) | (9-225) 
有 控制 信号 时 的 卡尔 曼 滤波 方程 为 
xC(k+11k)=® (k+l RXRE) TBRERuE) HK' CR Tv CR) HHOEIXCE)] (9-226) 
根据 式 (9-225) 和 式 (9-226) 可 得 如 下 结论 ，; 
中 因为 u(%) 是 x(%) 的 线性 函数 , 故 X 与 u(%) 正 交 , 表 明 庆 (8) 不 受 &(%) 的 影响 。 
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加 在 式 (9-226) 中 ,KK'CRD)[v(8) 十 HH(R)X(E) 为 白 品 声 , 其 协 方 差 阵 为 
DB (R 十 1 ,8)P(R|R 一 1) 再 (RD)[LRoCR) 十 百 (E)P(E|R 一 1)8 (RD) 。 
HOR)PCE IR—1)® (k+l1,k) 

式 中 P|k 一 1) 为 估计 误差 方差 阵 。 

(@@) 估 值 x(% 十 11) 的 方程 (9-226) 与 真 值 x(& 十 1) 的 方程 (9-196) 具 有 相同 的 形式 ,只 
是 前 者 的 白 噪声 为 K'(&)[y C4) 十 HC(R)XCk)], 而 后 者 的 白 噪声 为 w(&)。 . 

@ 在 性 能 指标 式 (9-225) 中 ,等 式 右 端 第 二 项 与 g&(&) 无 关 , 因 此 选择 &(&) 使 性 能 指 
标 式 (9-225) 极 小 ,等 价 为 


N—1 
J = 5mink (XT CONFXCN)+ DO [xT OR)QCOIXCE) HUT RORCENME)]) (9-227) 
ut 大 ) 记 二 昌 


式 (9-227) 与 式 (9-199) 在 形式 上 完全 相同 。 

由 以 上 比较 可 知 ,(1) 中 的 结构 可 以 直接 应 用 。 因 此 

PH (Rk)=u’ (k)=—K(k XR) (9-228) 

表明 最 优 控 制 律 为 最 优 估 值 x(&) 的 线性 函数 。 

由 上 述 结论 @ 可 知 , 式 (9-223) 中 的 Q,(%) 应 用 

QR) 一 久 (k++1, RIP(EIE—1)H' RT Ro CE) 
HOR)PCOEIE—1)H (Rk)) HOR)POEIE— 1)G (1,k) 

来 代 苦 。 帮 以 (4%) 代表 式 (9-223) 中 的 7(8), 则 (8) 应 满足 以 下 方程 : 


eCk)=trL P(ET1) QO (ER) | +é(k+1) (9-229) 
E(N)=0 
按照 式 (9-229) 的 递 推 关系 ,可 逐 级 算出 E(k)。 求 出 PC) 和 &(&) 以 后 ,可 得 
WIx(k) |=x  (k)P(EOxCE) + EE) (9-230) 


于 是, 总 的 最 优 性 能 指标 为 


J FE W[x(0)]) 十 二 记忆 位 xzTCV)EFYCN) 十 之 (DOQCDOECD | 


一 FmIP(O)mot Str (FPCN) 十 3 [P(E+1)Q (8)+QO(EP(E LO— 1]) 
天 一 站 


至 此 ,离散 系统 的 分 离 原 理 证 明 完 毕 。 
例 9-3 设 系统 状态 方程 
XT(k+1)=zr Ck) +2u Rw lk), xz(0) 一 0 
量 测 方程 
z(k)=zr(k)+vu(k) 
性 能 指标 / 


J=E| zx’(3)+ ec 


已 知 (6 和 (为 互 不 相关 的 零 均 值 白 品 声 序 列 ， 其 方差 分 别 为 Qu(A) 王 25 和 RCR) 一 
15, 急 始 状 态 的 均值 及 估计 误差 协 方差 的 初 值 为 

El[z(0)]=0, P(0|0_)=E[zx:(0)]=100 
试 求 随机 输出 反馈 最 优 控 制 u* (0) ,wu* (1) 和 w* (2)。 
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解 ”本 例 为 三 级 决策 过 程 。 由 题 意 


则 由 估计 误差 协 方差 方程 (9-206): 
P(Ek1|k)=BETI ,RPEIER— 1)B' (k+l1,k)+Qo RE) 
~—D(k+1, RPE|IR— 1)HT (Ek) 
» THOEOPOEIE—IHT TR TRE] IREIPCEIE—1)B' (E+1,k) 
可 得 
PETIIE=POEIR 1 PAIR DIPEIE— D415] P| 1)+25 
由 卡尔 曼 增 益 阵 方程 (9-205) ,得 
K’'(k)=P(Ek|IR— EPRIR—1)+15] 
根据 题 意 ,二 1,Q(%) = 二 0,R() 二 1, 故 由 黎 卡 提 方 程 (9-202) 得 
已 (E) 一 已 (RE 十 1) 一 4P2(R 十 1)L1 十 4 已 (十 1)] 一 : 
由 状态 反馈 增益 阵 表 达 式 (9-201), 可 得 
K(k)=2[1+4P(k+1)1 'P(R++1) 
计算 结果 如 表 9-1 所 示 。 


表 9-1 计算 结果 表 
P(g|k—1) K(k) P(E) K(k) 
3 37.1 1. 000 
2 36. 9 0.710 0. 200 0. 400 
1 38. 1 0.717 0. 111 0. 222 
0 100.0 0. 869 0. 077 0. 154 


因为 zx(010_.) 王 xz(0) 一 0, 所 以 各 级 最 优 控制 为 
xz (0) 一 一 0.154z(010_) 一 0 
ws (1) 一 一 0.222z(110) 
u” (2) 一 一 0.400z(211) 


习 起 


9-1 设 微分 方程 为 
x(t)=FCGx()HGGWw), xr(0)=xo 

已 知 {xo}=mo,E{w)}=0,E{xow' (it)}=0, 且 有 

E{w(l)w (1)}=0,() 
定义 二 次 矩阵 为 

P(t)=E{x(t)x' (t)) 

P.(0)=E{xoxe} 

求证 :Pi(z) 满 足以 下 矩阵 方程 及 初始 条 件 
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P(t)=FOG)P CG) +P OF GHGGO)G () 
P'.(0)=E({xoxo) 
9-2 设 一 探 空 火箭 ,当空 气 阻力 与 火箭 重量 相 比 可 以 略 去 不 计时 ,其 动力 学 方程 为 
Z(t) =p(t) 


h(t) = 一 二 f(t) 


m(t)v(t)=f0)—m(lt)g 
式 中 (2) 为 火 前 飞行 高 度 ,v 0) 为 火 稍 速 度 ,mG) 为 火 第 质量 ,fG) 为 火 第 推力 ,c 为 比 推 
力 ( 渭 数 ),g 为 重力 加 速度 (常数 )。 已 知 随机 变量 xo,vo,m(0) 的 均值 都 等 于 零 , 且 彼 此 不 
相关 ,方差 (xo}、E(v0} .Em (0)}) 给 定 ,E{fGQ2)})= 二 f= 二 常数 ,E{[f() 一 fo]) 一 5。 试 求 
Zi .vl2) 与 m4) 的 均值 与 方差 。 : 
9-3 设 随 机 系统 状态 方程 为 

(£2)=F(xX() HG u(t) wi) 

其 状态 转移 矩阵 为 @ (tr), 且 满足 下 列 方程 ; 


CB nD)=—F' (DG (1 ,T), @ (r,t)—1 


试 证 明 ;x(z) 的 均值 和 方差 阵 分 别 为 
E(x()}=® (rd) EtxCe0))}+| B UGOE {wr) dr 


Pi) 一 中 (4,£)P, Bro)+| 中 (£ ,TIGCTIO TG (TB ,7) dr 


9-4 设 随 机 系统 方程 为 


Zi1(t) = x (1) 
zat)=—Tzlt) + hult) +wl) 


y(t) = x (t) 
式 中 w(z) 为 零 均值 白 品 声 , 其 方差 为 gq:。 试 求 最 优 控 制 u* (1) ,使 下 列 性 能 指标 极 小 ， 


7=E{] ED+eecD]d| 


式 中 o>0,a>0。 要 求 画 出 系统 的 方 框图 。 
9-$ 设 随 机 系统 方程 为 
Z(t) =u(t) rw (i) 
z(t)=zx(t) T+v() 
式 中 w(t) 与 v() 为 互 不 相关 的 零 均 值 高 斯 白 噪声 ,其 方差 分 别 为 gq: 和 vr?。 试 求 最 优 控 制 
上 (zt) ,使 下 列 性 能 指标 极 小 : 
/= 5E (x (£7) +| pw’ (dt | 
式 中 2>0。 并 要 求 计 算 最 小 性 能 指标 及 绘 出 系统 方 框图 。 
9-6 设 离 散 系 统 状态 方程 和 量 测 方程 为 
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(RE 十 1) 一 2z(&) 十 KR) 

z(k)=zx(k)+v(k) 
式 中 v(k) 是 零 均值 高 斯 白 噪声 序列 ,其 方差 为 5。 已 知 v() 与 随机 初始 状态 z(0) 不 相关 ， 
目 E{x(0)) 一 0,P(010. ) 一 已 (到 (0)} 一 50, 性 能 指标 为 

=5E(z (4)+ Du (k)| 


到 一 站 


试 求 随机 最 优 控制 序列 zx (8),&k 二 0,1,4,3。 
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第 10 章 实用 最 优 控制 系统 


前 面 九 章 已 比较 详细 地 介绍 了 最 优 控制 的 基本 理论 .我们 知道 ,最 优 控制 问题 实质 就 
是 : 找 出 允许 的 控制 作用 (规律 ) ,使 动态 系统 (被 控 对 象 ) 从 初始 状态 转移 到 某 种 要 求 的 终 
端 状态 ,并 且 保 证 某 种 要 求 的 性 能 指标 达到 最 小 (大 )。 比 如 ,我 们 希望 宇宙 飞船 在 距 地 球 
表面 某 一 高 度 上 飞行 ,假设 这 里 只 考虑 控制 飞船 纵 轴 稳定 地 跟踪 当地 水 平 轴 , 即 飞船 的 参 
考 轴 的 一 个 轴 的 控制 问题 ,并 假设 用 喷气 发 动机 作为 姿态 控制 系统 的 动力 。 在 某 一 时 刻 ， 
由 控制 装置 (如 计算 机 ) 给 出 控制 飞船 纵 轴 跟 踪 新 的 给 定 参考 轴 的 指令 ,在 控制 指令 作用 
下 ,要 求 在 一 定时 间 内 完成 这 种 调整 过 程 ,并 且 要 求 燃 料 消耗 最 少 ,这 就 是 燃料 消耗 最 少 
控制 问题 。 

研究 理论 的 目的 在 于 应 用 ,目前 , 随 着 工业 控制 计算 机 、 微 电子 器 件 、 数 字 控 制 系统 的 
大 量 涌现 ,以 及 控制 算法 的 不 断 改 进 , 最 优 控制 理论 在 工程 中 已 得 到 越 来 越 广泛 的 应 用 。 

用 控制 系统 自动 实现 最 优 控制 的 例子 有 很 多 。 比 如 ,在 航船 上 安装 一 种 叫做 综合 导航 
系统 的 装置 , 它 能 够 自动 规划 出 最 优 航线 ,自动 确定 航船 位 置 ,并 实现 监视 航行 .为 了 保证 
船舶 在 广阔 的 海面 上 能 够 实现 自动 航行 ,可 以 利用 全 球 卫 星 定 位 系统 ,用 它 测 出 船舶 当前 
的 位 置 和 航线 ,把 测量 得 到 的 航线 与 要 求 的 航线 进行 比较 ,由 电脑 经 过 计算 ,确定 出 应 该 
如 何 控制 舵 机 ,才能 够 使 船 按 要 求 的 航线 自动 行驶 下 去 ，。 

本 章 将 介绍 一 些 实用 最 优 控制 系统 的 例子 ,包括 高 速 高 精度 数字 伺服 系统 的 时 间 次 
优 控制 ;III 型 数字 伺服 系统 的 ITAE 性 能 指标 最 优 控制 ; 交 直 流 混合 电力 系统 直流 制 动 
的 时 间 - 能 量 双 指 标 最 优 控制 ;二 级 倒立 摆 的 二 次 型 最 优 控制 ;电动 公交 车 直流 奉 引 电动 
机 驱动 系统 最 优 控制 等 。 


10. 1 高 速 高 精度 数字 伺服 系统 的 时 间 次 优 控制 


由 直流 电力 拖 动 及 交流 电力 拖 动 组 成 的 数字 式 位 置 伺 服 系统 是 当前 应 用 最 广泛 的 电 
力 拖 动 系统 。 如 数控 机 床上 用 的 伺服 系统 .飞行 器 制导 系统 .火箭 或 弹道 发 射 架 的 控制 系 
统 、 高 射 火 炮 的 控制 系统 .雷达 天 线 控制 系统 等 。 

本 市 重点 介绍 高 速 、 高 精度 伺服 系统 的 时 间 最 优 控 制 问题 ,作为 高 射 火炮 的 数字 控制 
系统 ,必须 具有 很 高 的 跟踪 角速度 与 跟踪 角 加 速度 的 能 力 , 才 能 从 跟踪 一 批 目 标 迅速 转换 
到 跟踪 万 一 批 目标 .同时 ,由 于 被 跟踪 射击 的 目标 甚 远 , 这 就 必须 有 极 高 的 跟踪 精度 、 极 小 
的 稳 态 误差 才能 获得 好 的 射击 效果 。 

由 上 述 可 知 , 对 这 一 类 高 速 、 高 精度 数字 伺服 系统 ,在 单位 阶 幅 输入 作用 下 ,我 们 希望 
其 过 渡 过 程 为 最 佳 过 渡 过 程 , 即 时间 最 优 控制 。 


10.1.1 系统 介绍 
该 系统 的 原理 如 图 10-1 所 示 。 
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a 8 控制 计算 机 
及 其 接口 | 


Mm" 


旋转 / 数 了 转换 
及 其 锁 存 电路 


图 10-1 高 速 .高 精度 数字 伺服 系统 原理 图 

图 10-1 中 数字 量 信和 半 发 生 器 用 以 发 出 阶 牙 信号 、 等 角 速 正 / 反 转 信号 和 正弦 信号 共 
四 种 指令 ,各 种 信号 均 以 16 位 自然 二 进 制 码 的 形式 给 出 。 它 所 发 出 的 信号 就 是 该 系统 的 
输入 角 0 ,在 检测 该 系统 时 , 它 模拟 系统 的 上 一 级 计算 机 。 

误差 角 显 示 青 根据 和 . 粗 六 、 精 和, 计算 出 该 系统 的 误差 角 0., 以 模拟 数字 打印 等 多 种 
方式 显示 该 系统 的 动态 响应 或 稳 态 误差 。 误 差 角 显示 器 为 调试 和 检测 该 系统 带 来 很 大 的 
方便 。 需 要 指出 ,这 两 者 不 是 系统 的 组 成 部 分 。 

图 10-1 中 ,6 为 系统 输入 角 ,0. 为 系统 输出 角 。 系统 主要 由 控制 计算 机 、 被 控 对 象 、 位 
置 反馈 三 部 分 组 成 。 

控制 计算 机 以 16 位 单片机 MCS-96 为 主体 (当前 也 可 用 DSP 器 件 或 相应 的 新 一 代 
单片机 取代 ) , 按 最 小 系统 原则 设计 , 它 有 三 个 输入 接口 和 四 个 输出 接口 。 

输入 接口 :由 两 片 可 编程 的 并 行 I/O 扩展 芯片 8255A 的 口 A. 口 B. 口 C 组 成 。 来 自 
数字 量 信 和 号 发 生 器 (数字 正弦 机 ) 的 输入 信号 8(16 位 ) 经 两 片 8255A 的 口 A 进入 控制 计 
算 机 ,系统 输出 角 9。 经 110XSZ1/32 多 级 双 通 道 旋转 变压器 和 2X12XSZ741 旋 变 /数字 
转换 器 及 其 所 存 电路 完成 绝对 式 轴 角 编码 的 任务 ,将 输出 角 9, 转换 成 粗 精 各 为 12 位 的 
自然 二 进 制 数 码 。 该 数码 经 锁 存 后 , 取 粗 12 位 和 精 11 位 由 8255A 的 口 B.、DC 进入 控制 
计算 机 。 经 计算 机 软件 运算 ,将 粗 、 精 合并 ,最 后 得 到 16 位 数字 量 的 系统 输出 角 0.。 

四 个 输出 口 分 别 为 主 控 输 出 口 .前 馈 输 出 口 和 两 个 误差 角 &. 显示 口 。， 

主 控 输 出 口 由 12 位 D/A 转换 芯片 DAC1210 等 组 成 。 其 中 包含 与 系统 误差 角 9. 及 
其 一 阶 差分 Ab. 成 正比 的 信号 ,其 输出 为 系统 的 模拟 主 控 信 和 号 。 

前 馈 输 出 口 由 两 片 8 位 D/A 转换 芯片 DAC0832 等 组 成 。 其 中 包含 与 系统 输入 角 4 
的 一 阶 差 分 A0 、 二 阶 差 分 A 成 正比 的 复合 控制 信号 及 补充 信号 。A 信号 经 数字 滤波 
后 骨 与 Ab 信号 及 补充 信号 一 起 经 模拟 滤波 器 滤波 ,然后 作为 系统 控制 量 的 组 成 部 分 作 
用 于 系统 。 其 输出 为 系统 的 模拟 前 馈 信 和 号。 z 

粗 9. 显示 站 和 精 4. 显示 口 分 别 由 8 位 D/A 专用 芯片 DAC0832 组 成 。 其 模拟 输出 口 
可 搂 示 波 天 显 示 , 以 便 实 时 观测 系统 误差 大 小 。 粗 9. 显示 口 可 显示 误差 为 18. | 之 0100H， 
当 |0.| 二 0100H 时 ,其 输出 为 零 。 

为 了 精确 计算 角度 ,在 兵器 系统 的 计算 中 常用 1 密 位 为 角度 的 基本 单位 。 定 义 ;1 密 
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位 = lmil= 55 一 0.06"; 精 显示 口 可 显示 误差 为 1.|<12mil， 
被 控 对 象 可 以 看 作 由 PWM 放大 器 、 执 行 电 机 、 减 速 器 .负载 .测速 发 电机 、 无 源 校正 


网 络 等 组 成 。 
10. 1. 2 被 控 对 象 及 其 数学 模型 的 建立 


由 图 10-1 知 , 从 控制 计算 机 的 角度 看 ,PWM 放大 器 (若是 交流 驱动 也 可 由 各 类 新 型 
交流 驱动 器 取代 ) .执行 电 机 、 减 速 器 、 负 
载 . 测 速 发 电机 、 无 源 校正 网 络 可 看 成 一 


Cia 。 0 一 一 加 到 庆 
Co -上 3 > 个 整体 ,统称 为 被 控 对 象 。 所 以 ,被 控 对 象 
R 0 


R Rs 


35” 本身 就 是 一 个 闭环 系统 。 现 将 无 源 校正 网 络 

1 I 及 其 有 关 部 分 划 出 ,如 图 10-2 所 示 。 其 中 ， 
CG, RI=]1kOt5.6k0=6, 6kQ, R,= 5. 6kQ, 
R;=510kQ, Ri=7. 5kQ,C, = 10uF, R= 


Re 2- 3kQ ,测速 发 电机 型 号 为 45CY003, Rw 的 
10kQ ] 十 全 与 执行 电机 回 轴 分 讨 比 阐 试 后 实测 为 0. 65。 
建立 被 控 对 象 的 数学 模型 ,PWM 放 
图 10-2 系统 的 校正 网 络 大 天 可 近似 地 看 成 一 个 放大 环节 , 记 作 
天 pww。 控 制 变量 Ci (模拟 电压 ) 为 其 输入 ， 
执行 电机 的 电 枢 电压 Ca( 指 平均 值 , 下 同 ) 为 其 输出 。 经 实测 得 知 Kpwx = 13。 
执行 电机 型 号 为 ZK-21G ,其 参数 为 :额定 功率 已 .=1. 4kW ,额定 电压 U, 二 110V ,和 额 
定 电流 7 一 16A ,额定 转速 mm 一 6000r，min ,励磁 电压 110V ,实测 电 枢 电阻 R. 一 0. 80，。 
经 计算 知 ,执行 电机 转子 转动 惯量 .负载 转动 惯量 在 电机 轴 上 的 折算 值 、 减 速 器 转动 
惯量 在 电机 轴 上 的 折算 值 ,这 三 者 之 和 J/=0. 0157kg。ms:。 
对 于 执行 电机 这 一 环节 ,其 输入 为 电 枢 电 压 UU, 输出 为 其 角速度 Qu ,其 传递 函数 近似 
为 :Ks/CTms 十 1) ,其 中 民 , 二 1/C.,T。s 二 JR。/C?, 其 数值 为 
Us—{.R,_ 110 一 16X0.8 


Ce = D7 D7 ~=0.155(V 。s) 
“n G0 6000X 0 

1 1 _ . -1 
大 = 一 去 0 TE5 6. 45(V 。 s) 

_JR,_0.0157X0.8 

mm (2 四 0. 155? 一 0, S52(s) 

所 以 执行 电机 的 传递 函数 为 
0. 45 
0. 525 十 ] \10-1) 


作为 减速 器 这 一 环节 ,输入 为 执行 电机 角速度 Da, 输出 为 该 系统 的 输出 9,。 由 于 0 
用 1/s 为 单位 ,而 9 以 8 为 单位 ,1 一 一 19. 8rad - s,16— i 
位 。 

改 以 上 假设 会 给 数字 系统 的 计算 带 来 许多 方便 ,因为 车 数字 伺服 系统 的 输入 角 是 16 
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位 的 , 即 要 求 输出 轴 可 以 驱动 到 的 位 置 有 24= 65536 个 ,在 此 情况 下 ,我们 可 以 将 一 个 圆 
周 角 (360° 或 6000 密 位 ) 等 分 成 65536 份 , 每 份 记 作 16。 又 由 于 减速 器 的 传动 比 为 206, 故 ， 


其 传递 图 数 为 


2 wl 30.6 
206X2 5 5 


经 实测 得 知 : 测 速 发 电机 的 比 电 势 为 0.197V，s, 由 图 10-2 以 R 点 的 电位 为 输入 ,以 
S 点 的 电位 为 输出 ,其 传递 函数 为 | 
TR Rs (Rs+R)Cs+1) 
RN | Rute Rs (CRC1s+1) 


并 联 校正 装置 (输入 为 执行 电机 角速度 24, 输 出 本 应 为 § 点 的 电位 ,为 了 以 后 画 方块 
图 方便 ,输出 看 作 是 P 点 的 电位 ) 的 传递 函数 为 
RL CR ROCSsS+1] RI 


(10-2) 


(10-3) 


0. 197X 0.65— 
” Rs (人 4L43 十 1) 一 全 5 (10-4) 
_ 1.66X10-(10. 35s+1) : 
0. 15s 十 1 


为 了 保证 本 系统 很 高 的 精度 要 求 引 和 人 复合 控制 .在 数字 伺服 系统 中 ,是 由 系统 本 身 的 
控制 计算 机 来 产生 输入 角 的 一 阶 差 分 及 二 阶 差 分 信和 号 的 , 即 久 ,.。Ap 及 天.。Az20; 均 要 通 
过 专门 化 的 模拟 滤波 ,这 时 的 天,，A:0( 即 图 10-1、 图 10-2 的 C2,) 实 际 加 到 Q 点 , 若 看 成 
加 到 P 点 , 则 应 乘 以 Ri/Rs 二 6.6X103/5.6X10; 二 1.18,. 由 以 上 分 析 可 知 调节 对 象 的 方块 
图 如 图 10-3 所 示 ,其 等 效 方块 图 见 图 10-4。 

CC 
下 四 
人 


十 
/i 
— 


3724{0.15s+!) 
s{1.81s+1)(0.038s+1) 


图 10-4 调节 对 象 的 等 效 方块 图 
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10.1.3 基于 时 间 次 优 的 控制 算法 设计 


最 优 控制 问题 是 在 规定 的 约束 条 件 下 , 求 使 性 能 指标 

ASNSAooH upaoy ”达到 极 值 的 最 优 解 的 问题 。 在 这 套 实用 的 高 速 、 高 精度 数 

$Y “ 字 伺服 系统 中 ,性 能 指标 是 指 在 单位 阶 路 输入 作用 下 的 过 

滤 过 程 时 间 。 所 以 具体 来 讲 , 在 本 系统 中 最 优 控制 问题 就 

是 系统 在 单位 阶 跃 作用 下 使 过 渡 过 程 时 间 最 短 、 超 调 其 接 
近 零 .振荡 次 数 也 为 零 的 控制 问题 。 

图 10-5 为 根据 误差 角 0. 不 同 ,将 控制 划分 为 不 同 的 


8000H 


_8000H 控制 区 的 所 谓 误差 角 圆 图。 
图 10.5 误 益 角 图 图 10-6 是 系统 中 与 误差 角 & 有 关 的 控制 变量 C. 与 
9. 之 加 的 关系 示意 图 。 


由 图 10-6 可 知 ,系统 的 调节 过 程 分 为 三 个 区 域 , 即 1 区 为 线性 区 ,II 区 为 二 次 最 优 则 
线 控制 区 ,III 区 为 邦 - 邦 控制 区 。 


| 
| Bang-Bang | 
控制 区 
0C00H 二 次 最 优 ， | 
IAA 曲线 区 | 
C000H FFO0H 0050HL- / - 
8000H  (-4000H) ”(-0100H lI 
ii 了 100H 4000H 7FFFH 


| 
| 
| 
| 
L 
| 
| 
| 


图 10-6 控制 变量 C. 与 误差 角 6. 的 关系 


系统 的 稳 态 误差 .等 速 跟踪 误差 .正弦 跟踪 误差 等 均 取 决 于 I 区 的 控制 算法 。 但 当 系 
统 的 阶 唉 输入 值 大 于 2566 时 ,系统 的 动态 响应 不 仅 与 I 区 的 控制 算法 有 关 , 而 且 与 II 区 
的 控制 算法 有 密切 关系 。III 区 为 Bang-Bang 控制 区 。 各 区 的 作用 将 在 下 面 详细 描述 。 

极 小 值 原理 和 动态 规划 法 是 求解 最 优 控 制 的 主要 方法 。 最 优 性 原理 的 含义 是 ;在 一 个 
多 极 决策 过 程 中 ,最 优 决策 具有 这 样 的 性 质 , 即 不 管 初始 级 ,初始 状态 和 初始 决策 如 何 , 当 
把 其 中 任何 一 级 的 状态 作为 初始 状态 时 ,余下 的 决策 必 构 成 一 个 最 优 决策 ,我们 把 整个 控 
制 区 分 成 了 工 II\III 三 个 区 域 ,根据 最 优 性 原理 ,分 别 在 每 个 区 域内 进行 最 优化 的 设计 ， 
则 总 的 控制 律 就 构成 一 个 过 渡 过 程 时 间 的 次 优 控 制 ,得 到 单位 阶 跃 作用 下 的 最 佳 过 渡 过 
程 。 

一 切 伺服 系统 的 控制 变量 都 是 受 限 的 ,而 处 理 变量 不 等 式 约束 的 在 线 计算 量 又 很 大 ， 
由 于 采样 周期 的 限制 ,难以 用 微 处 理 机 实现 实时 控制 ,对 于 一 个 实际 的 数字 伺服 系统 由 于 


. 334 。 


要 保证 它 等 速 跟踪 及 正 弦 跟踪 的 精度 ,因而 使 用 简单 的 Bang-Bang 控制 是 满足 不 了 实际 
要 求 的 ,必须 采用 Bang-Bang 区 、 等 加 速 控 制 区 及 线性 控制 区 来 达到 目的 。 
表 10-1 所 示 为 系统 的 控制 变量 表 。 : 


表 10-1 控制 变量 表 


II 
Cn) 120.Cn) Fi1[0.Cn)] 
Ciz(n) 64[0.Cn)—0.(n—1)] | Fs[O. Cn)O.n—1)] 0 Cin) Cin) Cs(n) 
DC 
C13Cn) 7 OLO.Cn) 6.Cn—1)] 送 主 控 输 出 1 


送 复合 控制 输出 口 Cz 


由 于 存在 量化 误差 以 及 外 部 干扰 的 影响 ,系统 采样 得 到 的 输入 信号 无 法 直接 应 用 , 必 
须 进行 数字 滤波 处 理 。 数 字 滤 波 方法 有 如 下 几 种 。 
(1) 限 幅 滤 波 
全 ， 一 Ze | Ax 
了 ,一 
Trls |z 一 Zo|Az 
即 用 本 次 采样 值 减 去 上 次 采样 值 , 求 出 其 增 量 绝对 值 与 设 定 的 最 大 允许 偏差 范围 相 比较 ， 
看 位 于 最 大 允许 偏差 范围 以 内 , 则 取 本 次 采样 值 ; 若 大 于 最 大 允许 偏差 , 则 把 上 次 采样 值 
作为 本 次 采样 值 。 
现 确 定 本 系统 的 最 大 允许 偏差 范围 。 若 采样 周期 了 = 1. 5ms, 系 统 跟踪 角速度 为 
100°/s, 则 Ab 的 最 大 允许 值 为 : 


16 
Ad,(max)=—100°/s X1. Sms X 一 27. 36 


360° 
实际 上 ,为 了 留 有 余地 , 取 A0,(max) 二 325=20H，。 
(2) 限 速 滤 波 
oe de 
Ar,， |Az, | = | x, — Xn 之 1 Az | 
即 用 本 次 采样 值 减 去 上 次 采样 值得 速度 , 当 其 绝对 值 小 于 最 大 允许 速度 时 , 则 取 之 ;否则 
取 最 大 允许 速度 作为 本 次 的 速度 。 本 系统 中 对 Ab 和 Ab. 的 限 幅 就 是 应 用 这 种 方法 。 以 
Alb. 为 例 , 见 限 幅 滤波 中 的 分 析 。 其 最 大 允许 速度 Al(max) 一 20HL。 
(3) 算 术 平 均 滤 波 


Y= 一 zli) 
人 在 主 控 变 量 控 制 算法 的 程序 设计 中 ,对 A6 和 Ab. 的 滤波 就 是 应 用 这 种 方法 。 以 Ab 
为 例 : 
AZ (一 言 之 Ab 人) 


(4) 对 9; 二 阶 差 分 的 滤波 
系统 输入 角 的 二 阶 差分 为 
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A’0.(n)=0.(n)—20(n—1)+0. (nm 2) 
为 减 小 其 量化 误差 的 影响 , 需 对 A?0.(x) 进 行 数字 滤波 ,该 数字 滤波 右 为 一 FIR( 有 限 
冲击 相应 ) 系 统 。 其 单位 样本 响应 为 


] ， 2 一 0,1，…… 一] 
h(n)= 
0, 7 之 4 


式 中 M 二 62, 夺 ZT02) 为 输入 , 则 输出 为 


Y (n)= Dx(n—)) 
下 面 介 绍 复合 控制 的 实现 。 
如 图 10-7 所 示 ，, 系 统 达 到 稳 态 后 ,控制 系统 所 需 信号 之 一 部 分 或 全 部 由 前 馈 严 (*) 提 
供 , 从 而 大 大 减 小 系统 的 速度 误差 和 正弦 误差 ,以 提高 系统 的 稳 态 精度 。 玉 (5) 称 为 复合 控 


制 信号 。 
F(s)—=— (Ks K,s’)0.(Cs) 


即 
Fn)=K,AGn) + KAGn) (10-5) 
设 Cis(n) — K,.A0.(n) ,Cn)—= KA0.n) ;代入 式 (10-5) 得 
F(n)=Cs(n)+C,n) (10-6) 


式 中 Cis(n) 将 在 主 控 变 量 的 算法 中 实现 , 现 分 析 Cz《n) 的 设计 方法 。 将 获得 Ci(n)= 
K,A 0.(n) 与 前 面 所 述 的 数字 滤波 方法 合 为 一 起 实现 ,其 z 传递 函数 为 
下 (z) 一 天 一 2z 十 z )[ 1 十 z ! 十 z 十 … 十 zx 一 MY 


一 天 (1 一 > 一 1 一 zx“ 十 z 一 1 一 4) (10-7) 
取 M==62,K, 二 23, 代 人 式 (10-7) 得 
F(z)=23(1—z 1—z +z $3) (10-8) 


将 式 (10-8) 写 成 离散 微分 方程 形式 ,为 
Cn)—=K,A’On)=23|0.0n) 一 上 2 一 1 一 和 (2 一 62) 十 和 (2 一 63) (10-9) 
这 就 是 复合 控制 信号 的 实现 公式 。 


QO.(s ) + 和 Kk tl(s ) 
Oi(s)  - Ms)| sinst+!1) 


10-7 复合 控制 的 实现 


主 控 变 量 控制 算法 的 实现 有 如 下 几 种 。 
(1)6; 的 一 阶 差 分 
这 是 复合 控制 f(x) 的 一 部 分 , 见 式 (10-6)。 因 
Ci3(n)=K,.A0(n)=K, 0(n)—0.(n—1)] 
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到 天 ,一 于, 则 有 Ch) 一 [Co) 一 0 一 1 

(2) 线 性 控制 区 

如 图 10-6 所 示 , 当 12 和 0100HS 一 23. 4mil ,系统 工作 于 工区 , 即 线性 区 。 需 要 指出 此 
处 所 指 的 线性 区 ,并 非 该 数字 伺服 系统 的 线性 区 。 本 数字 伺服 系统 的 线性 区 只 有 约 4mil 。 
系统 的 等 速 跟 踩 误 差 .正弦 跟踪 误 善 .小 阶 牙 输入 的 稳 态 误差 的 大 小 以 及 动态 啊 应 的 好 
坏 , 皆 到 决 于 工区 控制 算法 的 设计 。 

I 区 的 控制 变量 包括 两 部 分 : Cun(n) 和 Cis(n)。 

Cu(n) 为 与 误差 角 和 有 关 的 控制 变量 。Ci (nx) 一 Kw0.(n) 二 Kw[0(n) 一 (nn)], 取 大 、 
一 1]2, 则 有 C(x) 二 12[6.(n) 一 0,(n) | 

Ciz(n) 为 与 误差 角 9.(x) 的 一 阶 差 分 有 关 的 控制 变量 。 

C21n)=K,mA0.n) = Kl A (n)— AO,n) | 
=K,wm[0.(n)—0.n—1)] 

取 民 ,w= 二 64, 则 有 Ciz(n)= 二 64[6.(x) 一 9.(x 一 1)j]。 

(3)Bang-Bang 控制 区 

如 图 10-6 所 示 , 当 4000H6 委 10.| 委 8000HS, 即 1500mil 声 |8.| 才 3000mil 时 ,系统 工 
作 于 Bang-Bang 控 制 区 。 在 该 区 域内 ,控制 变量 分 别 以 输出 正 最 大 值 和 负 最 大 值 进行 切换 
(根据 4 的 正 负 ) ,使 系统 以 最 大 角速度 向 消除 误差 的 方向 运动 。 具 体 为 

1000H ， 0. 守 0 
Ci(n)= 
{Coo i000 0.<0 

(4) 二 次 最 优 曲线 (等 角 加 速度 ) 控 制 区 

如 图 10-6 所 示 , 当 0100HS 过 10. | 二 4000H5, 即 23. 4mil 过 19. | 二 1500mil 时 ,系统 工 
作 于 二 次 最 优 曲 线 控制 区 。 对 于 大 幅 值 的 阶 跃 输入 (如 2990mil, 即 接近 180° 的 误差 ) 进 行 
协调 时 ,系统 将 首先 在 Bang-Bang 控制 下 全 力 加 速 ; 车 没有 II 区 ,系统 将 以 相当 大 的 角 速 
度 和 角 加 速度 即 相 当 大 的 动能 进入 线性 区 ,因为 线性 区 的 范围 很 小 ,不 足以 抑制 如 此 大 的 
惯性 ,系统 将 会 形成 很 大 的 超 调 量 、 经 过 多 次 振荡 才 会 协调 ,上 且 过 渡 过 程 时 间 会 加 长 ,从 而 
失去 了 Bang-Bang 控制 的 时 间 最 优 性 。 为 避免 这 种 现象 的 发 生 , 特 在 Bang-Bang 区 和 线 
性 区 之 间 设 置 了 一 个 二 次 最 优 曲线 区 ,使 系统 沿 曲线 y= 二 kz? 运动 ,其 中 y 表示 系统 的 角 


位 移 0.,z 表示 系统 的 角速度 守 。 它 的 含义 是 ,在 此 区 域内 系统 以 负 的 等 角 加 速度 运动 
(系统 在 减速 )。 这 就 能 确保 系统 在 进 和 人 线性 区 时 ,角速度 已 不 大 了 ,因此 可 使 系统 近 于 天 


超 调 , 且 过 渡 过 程 最 短 。 
理论 上 可 以 推出 , 当 在 II 区 内 等 角 加 速度 达到 系统 可 提供 的 最 大 值 时 ,可 实现 过 渡 
过 程 时 间 的 最 优 性 ， 
由 系统 的 误差 角 0. 二 0. 一 0, 得 
dg. dO0: do, 
dd dr (10-10) 
当 输入 为 阶 路 函数 0 二 常数 ,5 一 0, 有 
d0. d0, 
(10-}1) 


dd vd 
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在 本 区 域内 ,要 求 角 加 速度 为 常 值 , 即 人 全 一 C, 代 入 式 (10-11) 可 得 
d20. 
dr’ 

所 以 ,可 将 对 .的 二 次 最 优 曲 线 的 设计 转化 为 对 & 的 二 次 最 优 曲 线 的 设计 。 

根据 运动 学 定理 有 

| 4 人 -| d?0.(2) / 2 


d20 
一 本 LO 一 入 (to) | 


dz? dz _ 
或 写成 
Q22(17) — (0)= 2e.[0.()—0.00)] (10-13) 
式 中 当 系 统 由 I 区 进入 芽 区 的 时 刻 规定 为 零 时 刻 , 即 to 一 0; 系统 由 I 区 进入 I 区 的 时 刻 
为 tfo 


设计 控制 律 时 ,根据 现场 调试 的 情况 先 定 下 II 区 的 边界 ,这 样 9.(ty) 和 0.(0) 就 确定 
下 来 了 ;根据 调试 的 情况 和 经 验 定 下 II 区 进入 I 区 的 瞬时 角速度 0.(zy) ;至 于 系统 由 III 区 
进入 II 区 瞬时 的 角速度 Q2.(0), 它 就 是 系统 的 最 大 角速度 ,是 已 知 的。 将 这 些 数据 代入 
式 (10-13) 中 ,可 以 解 出 ss; 若 解 出 的 es 是 系统 能 提供 的 , 则 设计 工作 可 以 继续 进行 下 去 。 

就 I 区 内 任 一 时 刻 it 而 言 , 由 式 (10-13), 当 se.2.(0) .0.(0) 均 已 知 , 可 以 建立 0.(G) 一 
pi) 癌 的 范 数 关系 。 而 控制 变量 C1 与 82. 的 稳 态 关系 是 早已 知道 的 ,于 是 就 可 以 求 出 Cj 
与 0. 的 图 数 关 系 , 即 Ci (2 ) 一 开 1 ) | 

在 本 系统 中 ,0.(tj)= 二 0100H5==1. 4°,6.(0)==4000H5 二 90°,02.(/) 取 一 9"/s。 由 实验 
(将 系统 主 反 馈 断 开 , 系统 工 作 于 调 速 系统 方式 ) 得 知 , 稳 态 时 C;(n) 二 0,Ci(n) 在 范围 
0280H 一 07FFH 内 时 系统 角速度 为 70"/s。 将 这 些 数据 代入 式 (10-13) 中 有 

(—9):—(—70)’=2e.[1. 4— 90] 

解 之 , 即 .一 27. 2"/s ,注意 到 该 系统 最 大 跟踪 角 加 速度 为 60°/s’, 因 此 es 一 27. 2"/s: 是 可 
以 实现 的 。 

将 & = 二 27. 2"/s: ,02.(0)= 二 70°/s ,9.(0) 二 90" 代 入 式 (10-13) ,经 整理 得 


(2.(1)=— NY 54.40.(1)+4 (10-14) 


注意 到 CO (2) 一 0280H( 王 640) 时 ,2.(2) 一 一 70?/5 ,因此 有 


640 640, ,、/ 
Ca 一 一 7 人 人) 一 一 70 1)~V 54. 40(2) 十 4 
一 9.14V54. 40(2) 十 4 (10-15) 


为 了 市 省 控制 计算 机 完成 式 (10-15) 的 运算 时 间 , 可 以 根据 式 (10-15) 造 一 张 表 , 将 数 
据 固化 在 EPROM 中 。 控制 计算 机 在 执行 控制 算法 程序 时 ,通过 查 表 获 取 C1(n)。 这 个 表 
称 为 TC ,该 表 的 制作 过 程 如 下 所 述 。 

当 0100H 过 0. 二 4000H ,9.(nm) 的 高 字 节 为 01H,02H,…,3FH, 共 63 种 。TC,, 表 共 占 用 
2X64 个 存储 单元 ,前 两 个 单元 不 用 ,只 用 后 2X63 个 单元 , 放 63 个 C11(n) 值 。 将 TC,, 表 
的 起 始 地 址 也 记 作 TC。 不 用 TCi 和 TC 十 1 号 单元 。 TC 十 2X01H 和 TC, 二 2x01H 
十 1 号 单元 放 0.(xn) 的 高 字 节 为 01 时 的 Cu x) 值 ,…… 。 例 如 , 当 0600H 志 8. 志 06FFH,， 
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Ci(z) 取 同一 个 值 ,该 Cun) 放 在 TC 十 2X06H 和 TC 十 2X06H 二 1 号 单元 ,现在 来 计 
算 Cii(n)。 当 0600H 才 86. 才 06FFH ,可 以 近似 认为 0.(n)= 二 0600H。 
bg. (2 ) 一 0600HS 王 15368 一 8. 4°, 将 其 代入 式 (10-15) 有 


Culn)=9.14 V54. 50.(2) 十 4 一 196 一 00C4H 

TCu 十 2X06H 号 单元 放 0C4H,TCi 十 2X06H 十 1 号 单元 放 00H。 以 上 分 析 基 于 系 
统 被 控 对 象 元 惯性 这 一 假设 ,但 被 控 对 象 的 惯性 使 系统 实际 的 Q.( 记 作 Q.,) 与 满足 式 (10- 
14 ) 理 想 的 Q.( 记 作 Q4) 相 差 很 大 ,我 们 使 Cl) 正比 于 (024 一 02,) ,将 它 与 C1 (x) 相 加 后 
从 Ci 口 输出 。 信 号 C1) 使 CQ 与 Qu 相差 不 大 ,系统 以 较 低 的 角速度 由 I 区 进入 I 区。 

由 于 经 正比 于 系统 误差 角 的 一 阶 差 分 ,所 以 Cs(n) 正 比 于 (Ab 一 Ab.)。 其 中 Ab. 为 
实际 误差 角 的 一 阶 差分 ,控制 计算 机 很 容易 获取 。Ab。 为 理想 的 误差 角 的 一 阶 差 分 ,是 & 
的 函数 。 注 意 到 本 系统 的 采样 周期 了, 二 1. 5X10- 3s 二 1]. 5ms, 由 式 (10-14) 得 


16 
AGan)=1.5X10-SX< XC(—1) XV54.40 0 +4 


360 


一 一 0.273 V 54. 40.(n) 二 4 (10-16) 


与 制作 TCu 表 类 似 , 再 制作 一 张 TD 表 , 用 以 存放 一 A9w(n), 表 中 值 为 正 数 ( 而 不 是 负数 
的 补 码 ) 符 合 人 们 的 习惯 。 例 如 , 当 0600H 志 0. 才 06FFH 时 ,一 Abwa(n) 放 在 TD 十 2Xx06H 
和 了 DD 十 2X06H 十 1 号 单元 。 

0.(n) 二 0600HS= 二 15365 一 8. 4°, 将 其 代入 式 (10-16), 有 


Abu(z) 一 一 0.273 V 54. 40.(n) 二 4 二 一 0. 273 V54.4X8.4 十 4 一 一 5. 86( 取 一 6)， 
得 
—Adua(n)=6=0006H 
TD 十 2X06H 号 单元 放 06H,TD 十 2X06H 十 1 号 单元 放 00H。 在 本 系统 中 有 
Cl) 一 一 is[AbCz) 一 Ag.Cz)] (10-17) 
式 中 Ki, 二 159。 / 
具体 来 说 ,如 9. 二 0600H5, 由 以 上 分 析 可 知 此 时 Cu ln) 二 00C4H ,该 信号 使 系统 向 消 
除 旋 差 的 方向 运动 ,使 误差 角 趋 于 零 。 此 时 AGw (mn) 二 一 6。 可 以 分 三 种 情况 来 叙述 。 
1) 如 果 系 统 的 实际 角速度 偏 高 ,例如 ,A9.(n)== 一 7, 由 式 (10-17) 可 知 ,C,,(n) 二 一 159 
Xx[( 一 6) 一 (一 7)j= 一 159== 一 009FH, 它 起 着 抵消 C11(x) 的 作用 ,使 系统 角速度 下 降 ， 
2) 如 果 系 统 的 实际 角速度 偏 低 , 例 如 ,Ab.(n)== 一 5, 由 式 (10-17) 可 知 ,C,,(n) 二 一 159 
x[( 一 6) 一 (一 5)j=159= 二 009FH , 它 起 着 增强 Cu(n) 的 作用 ,使 系统 角速度 增高 。 
3) 如 果 系 统 的 实际 角速度 等 于 理想 的 角速度 ,如 A9.(n) 二 一 6, 由 式 (10-17) 可 知 ， 
Li(2) 一 0。 
由 式 (10-17) 得 
Ci (nn)=Ki{[ AG ln) ] 十 AD nn)) (10-18) 
式 (10-18) 就 是 设计 控制 算法 程序 中 求 取 Ci,(n) 的 依据 ， 
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10. 1.4 实验 测试 结果 


图 10-8 是 系统 在 误差 6. 二 2990mil 作用 下 的 单位 阶 路 过渡 过 程 曲线 ,该 曲线 是 用 专 
用 仪器 示 波 与 打印 结果 。 系 统 有 极 好 的 过 渡 过 程 , 超 调 量 近 于 零 ,振荡 次 数 为 堆 。 当 b= 
1500mil 时 ,系统 进入 工区 ,对 应 图 上 A 点; 当 9. 一 23. 4mil 系统 离开 II 区 ,对 应 图 中 已 点 
(B 点 较 难 准确 确定 )。 曲 线 4B 十 分 接近 抛物 线 ,整个 过 程 十 分 接近 最 佳 过 渡 过 程 曲线 ， 
实现 了 时 间 次 优 控制 。 


图 10-8 系统 在 单位 阶 牙 作用 下 的 过 渡 过 程 曲 线 


10.2 JII 型 数字 伺服 系统 的 ITAE 性 能 指标 最 优 控制 


本 节 介绍 一 种 以 ITAE 性 能 指标 为 设计 准则 、 实 现 最 优 控制 的 III 型 大 功率 数字 伺服 


10.2.1 系统 概述 


该 系统 设计 的 技术 难点 为 

1) 要 求 有 快速 的 动态 响应 ,单位 阶 跃 作用 下 过 渡 过 程 无 超 调 , 或 跟踪 90°/s (1. 57rad/ 
s ) 角 速度 ,在 跟踪 以 90"/s 及 80°/s?:(1. 40rad/s’) 所 决定 的 正弦 输入 情况 下 ,跟踪 误差 小 
于 4X10 rad(4mrad) 之 内 。 

2) 输 入 信和 号 的 变化 未 知 , 不 能 只 按照 某 种 特定 的 输入 设计 控制 律 。 

3) 不 来 用 通常 赖 以 提高 精度 的 复合 控制 。 

由 上 可 知 , 间 题 的 实质 可 归结 为 设计 综合 具有 优良 动态 性 能 的 高 阶 无 静 差 数字 伺服 
系统 .众所周知 ,兼顾 系统 动态 性 能 和 静态 精度 ( 含 稳 态 精度 ) 一 直 是 控制 系统 设计 者 试图 
加 以 解决 的 核心 问题 之 一 。 按 照 经 典 方法 ,无 法 解决 快速 性 和 精度 间 如 此 突出 的 矛盾。 

满足 二 次 性 能 指标 的 最 优 控制 , 因 能 得 到 解析 解 ,是 讨论 和 应 用 最 多 的 一 种 方法 ,但 
加 权 阵 的 选择 仍 要 依靠 设计 人 员 的 经 验 和 技巧 ,此 外 将 伺服 问题 转换 为 调节 器 问题 还 需 
对 输入 信和 号 的 形式 加 以 限定 ,这 不 适合 此 处 的 情况 。 


ITAE 意义 下 的 最 优 控制 ,是 使 性 能 指标 /二 | leco ldz 最 小 ,其 中 |eCt) | 为 系统 误 


老 的 绝对 值 .这 类 控制 的 优点 是 以 时 变 的 加 权 方式 对 不 可 避免 的 初 态 误差 加 权 小 ,使 系统 
具有 快速 义 平 稳 的 动态 性 能 ,同时 系统 的 品质 指标 对 参数 的 变化 不 太 敏 感 ,尽管 ITAE 最 
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优 控制 无 解析 解 , 但 可 以 得 到 具有 ITAE 控制 律 的 财 环 传递 晒 数 标准 型 .这 样 联 可 以 通过 
改变 系统 的 结构 ,通过 代数 方法 使 其 具有 ITAE 控制 律 ,因此 适合 工程 应 用 。 


10. 2. 2 系统 的 结构 设计 与 控制 律 设计 


由 有 关 参 考 文献 憩 , 按 匀 加 速 输入 无 差 设计 的 ITAE 三 阶 伺服 系统 ,对 单位 阶 暑 输 入 
响应 的 超 调 量 小 于 10%, 同 它 的 三 阶 无 静 差 性 能 相对 照 是 可 取 的 ,可 以 满足 本 系统 的 要 
求 。 然 而 ,迄今 为 止 ,ITAE 最 优 III 型 体 服 系统 在 工程 上 的 应 用 尚未 见 到 报道 。 

考虑 到 习 加 速 输 和 人 ITAE 三 阶 系 统 对 非 线 性 的 敏感 ,及 工程 实现 的 具体 条 件 和 限制 ， 
我 们 建立 适 于 工程 应 用 的 系统 结构 和 控制 律 , 运 用 它 成 功 地 实现 了 ITAE 最 优 控制 ,其 标 
准 闭环 传递 函数 为 

2. 97co8 十 4. 943s 十 oo: 
5 十 2. 97co8s 十 4. 94w3s 十 0w3 

wo 选取 得 越 大 ,系统 啊 应 越 快 ,但 wo 的 选取 受到 执行 机 构 最 大 输出 的 限制 ,可 以 从 
系统 的 传递 函数 .执行 机 构 最 大 输出 约束 值 ,利用 初 值 定理 估计 om 最 大 值 ,再 根据 所 要 求 
的 快速 性 ,根据 经 验 去 确定 o 的 适当 数值 。 

系统 的 饱和 非 线 性 将 破坏 ITAE 性 能 指标 ,甚至 导致 不 稳定 .解决 此 问题 的 途径 是 在 


有 限 的 线性 区 内 采用 ITAE 控制 律 , 超 出 此 范围 则 自动 转 为 Ve 控制 律 。 
ITAE 控制 系统 结构 的 推导 过 程 如 下 所 述 。 
不 失 一 般 性 ,可 以 假设 被 控 对 象 的 传递 函数 为 
上。 Ki 
lls 3 
实 为 一 惯性 环节 与 积分 环节 的 串联 。 式 中 Tt 是 受 物理 条 件 限制 .不 可 克服 的 小 时 间 
常数 。 采 用 零 . 极 点 对 消 方法 ,得 不 到 预期 效果 ,这 是 因为 驱动 的 能 量 有 限 。 采 用 零 .极点 
配置 及 最 简 结 构 分 析 , 可 以 较 方便 地 获得 具有 预期 的 闭环 传递 函数 的 系统 结构 ， 
与 式 (10-19) 标 准 ITAE 闭环 传递 函数 相 比 较 可 知 ,应 在 伺服 系统 环 路 内 再 配置 两 个 
等 点 和 一 个 零 极点 ,这 恰好 可 以 用 PID 调节 器 实现 。 于 是 基本 开 环 传递 函数 为 
Kl 十 Ts (1 二 区,s) 
s*(]++TEs) 
式 中 KK 一 KbK6。Ki,Ks 为 比例 环节 , 它 的 单位 反馈 下 闭环 传递 函数 为 
K[TT,s? + (TT,)s+1] 
Tess+ (1+TIT KR) HRT +T,)s+RK 


考虑 到 参数 取信 范围 受到 限制 ,可 用 局 部 软 反馈 汪 芭 “包围 惯 性 环节 ,如 
此 一 来 基本 闭环 传递 玖 数 为 


(10-19) 


(10-20) 


(10-21) 


K[T Tss:+ (Ti+T,)s+1IK 
+ RTT 1)s ts (TT)s+KR 
下 面 通过 状态 方程 做 最 简 结 构 分 析 。 标 准 三 阶 无 静 差 ITAE 最 优 传递 函数 的 状态 方 
程 为 


(10-22) 


{ee 


/ 10-23 
y(t)=C Xt) =r lt) 4. 94w8r2(t) 2. 97woxs (it) ( ) 
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式 中 


0 10 0 0 
—w —4.94w 一 2. 97cn ] 


(一 [zz 人 tyzst)]I，C 一 [ol ,4.94ow0y2. 97cuo 

选 定 式 (10-22) 为 基本 闭环 传递 函数 ,而 参数 玉 一 wii,K 开 TiT2: 一 2. 97owo, 天 (7T1 十 了) 一 4. 94 
os , 即 基本 闭环 传递 郴 数 为 

2. 97wos? 十 4. 94cw3s 十 wo 


CT 二 23. O70 | 4 904s Een (10-24) 
则 相应 的 状态 方程 为 
[Ay 二 AA p 
| It) Butlt) (0-25) 
y(t)=C x) 
式 中 


0 ] 0 
Al 二 0 0 ] 
—wi 一 4.94mwm 一 (1 十 2.97co) 


比较 状态 方程 式 (10-23) 与 式 (10-25) 可 知 , 它 们 的 差别 在 于 状态 zs (的 反馈 系数 。 如 果 
能 够 设法 引入 状态 反馈 ,如 图 10-9 所 示 , 则 基本 系统 便 具 有 标准 ITAE 三 阶 无 静 差 最 优 
控制 结构 了 。 


10-9 状态 方程 的 模拟 框图 


由 于 实际 系统 的 状态 并 非 全 都 可 以 测量 到 ,为 了 避免 状态 重 构 的 麻烦 ,利用 输入 来 实 
现 上 述 状 态 反 馈 。 由 式 (10-23) 得 


y(Cs)= (wo 十 4. 94ow0s 十 2. 97cos ) x1Cs) z (10-26) 
故 
Xi1(5) 一 一 一 2 
2. 97wos? 十 4. 94w8s 十 ol 
又 因 


2 
x (1) 一 名, 即 zs(s) 二 szx1(s) ,于 是 
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yy ]0-27) 
3 (5 一斑 97coos2 十 4. 94w2s 二 a5 


显然 ,只 要 在 基本 系统 的 闭环 传递 衣 数 方 框图 中 引信 式 (10-27) 所 示 的 等 效 输出 反 
馈 , 即 实现 了 ITAE 最 优 三 阶 无 静 差 最 优 闭 环 传 递 隔 数 。 
系统 实现 的 闭环 传递 函数 框图 如 图 10-10 所 示 ,系统 实现 简单 ,计算 形式 标准 。 


图 10-10 系统 的 结构 框图 


由 图 10-10 可 见 ,为 实现 ITAE 最 优 控 制 ,增加 了 两 个 反馈 通道 ,一 是 加 速度 负 反 馈 ， 
一 是 速度 正 反 馈 , 这 在 电气 传动 中 均 易 实现 。 同时 我 们 可 以 看 到 这 种 实现 方案 的 实质 , 即 


增加 两 个 反馈 环 从 而 造成 了 伺服 系统 中 第 三 个 纯 积 分 环节 全 <. 

在 传统 的 按 振荡 度 指标 设计 的 系统 中 ,总 是 尽 可 能 压缩 不 可 克服 的 小 时 间 常 数 ,以 使 
系统 有 较 高 的 增益 、 较 大 的 稳定 储备 ,但 这 样 做 总 是 受到 物理 条 件 的 约束 。 而 在 本 方案 中 
是 将 小 时 间 常数 改造 为 积分 环节 ,事实 上 其 结果 不 仅 提高 了 无 静 差 阶 次 ,还 比 传统 方法 所 
实现 的 系统 增加 了 相 角 储备 ,提高 了 频带 宽 ， 

ITAE 控制 律 对 侈 和 非 线性 较 敏感 ,由 于 工程 上 人 饱和 非 线性 的 存在 是 不 可 避免 的 ,这 
就 产生 了 双 模 控制 的 必要 性 。 即 系统 在 线性 区 外 ,采用 另 一 种 控制 律 。 

由 极 小 值 原理 出 发 的 Bang-Bang 快速 最 优 控制 ,理论 上 很 完善 ,但 在 工程 应 用 中 可 
能 会 产生 两 个 问题 :一 是 最 优 轨 线 计算 量 大 ,三 阶 以 上 的 系统 实现 起 来 十 分 复杂 ; 二 是 控 
制 效 果 对 状态 方程 系数 很 敏感 ,不 易 调整 。 相 比 之 下 , V5 控制 律 具有 简单 . 易 调整 的 优 
点 。V 控制 律 是 指 系统 的 速度 控制 服从 误差 平方 根 规律 。 

在 一 套 设置 有 电流 环 的 系统 中 ,在 启 . 制 动 过 程 中 系统 有 基本 恒定 的 角 加 速度 <。, 则 
ve 控制 律 可 使 系统 按 最 大 角速度 启 、 制 动 并 无 超 调 地 到 达 协 调 点 ,实现 时 间 最 优 控制 。 
设 系统 的 最 大 角速度 为 w。, 最 大 角 加 速度 为 a, 制 动 起 始 角 e, 则 无 超 调 的 含义 为 系统 在 
误差 由 eo 到 零 的 区 间 内 角速度 由 wu 降 为 零 。 


由 wr 一 2ame,， 有 ww 二 sgn(e)V 2as Vv |e|, 其 中 sgn(le) 为 误差 的 符号 晃 数 ,e。 可 由 w, 及 
an 求 出 。 


10. 2.3 系统 的 原理 框图 及 控制 软件 设计 
如 图 10-11 所 示 为 系统 的 原理 框图 。 其 中 执行 电机 为 Z132H 型 ,其 功率 为 7. 5KW , 额 
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定 转速 为 3000r/min ,额定 电 枢 电压 为 200V ,额定 电 枢 电流 为 40A。 系统 采用 PWM 放大 
器 作为 功率 放大 ,采用 双 通 道 自 整 角 机 作为 测量 元 件 。 


数字 控制 器 EE 


10-11 系统 的 原理 框图 


此 系统 当 误 差 在 [一 24, 十 24jmrad 区 间 时 按 ITAE 算法 工作 ,此 时 经 正 反 馈 网 络 处 
理 的 角速度 信号 经 模拟 开关 接 人 系统 ,系统 按 ITAE 最 优 三 阶 无 静 差 控制 工作 。 当 误差 


|eG)| 盖 24mrad 时 , 按 v e 方式 工作 ,模拟 开关 将 正 馈 网 络 信和 号 切除 。 
如 图 10-12 所 示 为 系统 的 控制 软件 程序 框图 。 本 数字 伺服 系统 采用 50Hz 以 上 采样 频率 
和 双 字 节 (16 位 ) 运 算 , 采 样 周期 在 10 一 20ms 之 间 。 运行 软件 按 典 型 功能 分 为 若干 模块 ,这 样 
就 使 软件 的 灵活 性 .通用 性 强 .。 程序 长 度 近 2KB ,在 用 6MHz 晶振 时 ,软件 运行 时 间 约 为 2ms 
主 程序 入 口 中 淅 服 务 子 程序 


EE 
= 
[| 


l 


ppp 
差 绝 对 值 、 符 


图 10-12 ”控制 软件 程序 框图 
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10. 2.4 实验 结果 


由 图 10-13(a) 中 可 以 看 到 ,由 2800 密 位 协调 (2. 93rad) .在 3s 内 就 完成 了 全 部 过 渡 
过 程 ,系统 按 最 大 加 速度 的 加 速 能 力 (2. 09rad) 达 到 最 大 转速 ,1s 后 又 以 最 大 的 减速 能 力 
(2. 09rad/s2) 制 动 到 零 且 几乎 无 超 调 ,符合 时 间 最 优 的 要 求 。 由 图 10-13(b) 可 知 ,在 跟踪 
由 1. 40rad/s,1. 40rad/s 决定 的 正弦 波 中 ,误差 仅 为 4.18X10-srad ,精度 很 高 。 


十 HH 
了 | 二 上 上 


0.Ssr 
(a)2800 凯 位 大 角度 协调 过 程 05/ 入 


”图 10-13 仿真 实验 结果 
由 上 可 见 , 用 ITAE 最 优 原理 设计 的 下 型 系统 大 大 优 于 用 经 典 设计 理论 设计 的 系统 。 


10. 3 ” 交 直 流 混合 电力 系统 直流 制 动 的 
时 间 - 能 量 双 指标 最 优 控制 


本 节 针 对 一 个 简单 交 直 流 混合 电力 系统 ,基于 非 线性 校正 榨 制 的 概念 和 最 优 控制 理 
论 ， 给 出 了 一 种 多 目标 最 优 的 直流 制 动 控 制 方案 ,并 对 构造 的 直流 制 动 非 线性 校正 控制 
系统 进行 了 数字 仿真 。 结 果 表 明 , 所 提出 的 时 间 - 能 量 双 最 优 的 控制 方案 , 在 交 直 流 混合 
电力 系统 受到 大 扰动 时 的 制 动 效 果 明 显 地 优 于 其 他 控制 方案 。 


10.3.1 系统 介绍 


当 电 力 系 统 遭 受 大 扰动 ,如 发 生 短路 故障 时 , 除 可 以 采取 传统 的 诸如 投 电 阻 制 动 . 切 
机 \ 切 负荷 等 暂 态 稳定 措施 外 ,还 可 以 通过 快速 调节 直流 传输 功率 Ps 的 办 法 ,以 使 系统 尽 
快 维持 和 恢复 稳定 运行 ,通常 称 之 为 直流 制 动 。 

直流 制 动 的 控制 方法 是 影响 其 控制 效果 的 主要 因素 ,因此 得 到 了 广泛 的 研究 和 普遍 
的 关注 。 


10. 3. 2 直流 制 动 非 线性 校正 控制 系统 的 数学 模型 


以 图 10-14 中 所 示 的 简单 交 直 流 并 列 输电 系统 作为 研究 对 象 , 设 系 统 1 和 2 为 无 穷 
大 系统 ,发 电机 下 为 一 等 值 机 。 

作为 一 种 暂 态 稳定 控制 措施 ,直流 制 动 不 可 避免 涉及 非 线性 控制 的 问题 ,因为 无 论 是 
描述 系统 的 数学 模型 ,还 是 直流 输电 本 身 ,都 具有 显著 的 非 线 性 特性 。 本 文 主要 采用 非 线 
性 校正 控制 的 概念 对 直流 制 动 进行 分 析 。 

下 面 对 所 采用 的 仿真 模型 作 简要 说 明 。 
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1) 发 电机 模型 。 
» [= |s 按 既 能 准确 描述 发 电机 动态 特性 又 不 至 于 过 
一 > 于 复杂 的 原则 , 选择 Park 参数 系统 下 的 三 阶 模 
> - 和 
E, 了 do 
—— P, di 
dw 
图 10-14 简单 交 直 流 并 列 输电 系统 i dr 


结构 示意 图 及 等 值 电 路 jy dE 


了 =— KdwP,—P. 


4 dr Er (XX aia, 
式 中 Pu 为 注入 机 械 功率 (同时 体现 直流 制 动 的 作用 );P. 为 输出 电磁 功率 ;T; 为 发 电机 
惯性 时 间 和 常数 ;Ei 为 发 电机 励磁 电势 。 

2) 和 直流 输电 的 数学 模型 。 

采用 准 稳 态 模 型 ,也 就 是 不 计 换 流 器 本 身 的 暂 态 过 程 ,以 稳 态 方程 表示 ;考虑 直流 输 
电 调 市 系统 的 作用 和 直流 线路 电流 变化 的 动态 过 程 ,其 动作 特点 用 微分 方程 描述 。 

直流 调节 璐 的 控制 方式 很 多 ,不 同 的 调节 器 模型 和 参数 ,在 暂 态 过 程 中 的 响应 特性 有 
较 大 差别 ,本 文选 用 啊 应 特性 较 快 的 比例 积分 环节 和 较 简 单 的 R-L 直流 输电 线路 模型 作 
为 算 例 ,其 调节 内 传 递 函 数 为 


居 (1 十 S7 3;) 
si 


G(s)= 
式 中 天 为 放大 系数 ;T, 和 了 ,为 时 间 常 数 。 

3) 网 络 方程 采用 代数 方程 表示 。 

处 理 非 线性 系统 尚 无 一 种 通用 的 方法 ,我 们 采用 如 下 的 处 理 方法 .将 待 仿 真 的 非 线 性 
系统 用 方 框图 来 描述 ,其 中 ,线性 部 分 的 各 个 方 框 均 为 标准 方 框 , 即 在 标准 方 框 中 的 传递 
咀 数 的 阶 次 不 高 于 一 阶 ; 非 线性 部 分 的 各 个 方 框 内 均 描 述 一 种 典型 的 非 线 性 特 人 性。 这 种 根 
据 仿 真 的 需要 改 画 的 方 框图 称 为 仿真 图 。 根 据 这 种 仿真 图 编制 仿真 程序 时 可 采用 模块 式 
结构 , 即 仿 真 图 中 每 一 个 框图 均 对 应 编制 一 段 计 算 子 程序 ,而 主 程序 则 根据 仿真 图 将 各 个 
方 框 相 应 的 子 程序 连接 起 来 , 按 一 定 次 序 逐 个 环节 进行 处 理 。 

这 种 模块 连接 式 仿 真 程序 主要 有 以 下 优点 ， 

可 以 很 方便 地 处 理 各 种 结构 的 非 线 性 系统 , 由 于 一 个 模块 只 描述 一 个 不 高 于 一 阶 的 
线性 环节 或 一 种 非 线 性 特性 。 因 此 ,研究 不 同 参数 不同 非 线性 特性 对 系统 各 个 状态 变量 
的 影响 十 分 直观 ;对 于 特殊 的 非 线性 特性 ,只 要 在 原 程 序 中 扩展 该 特性 的 仿真 子 程序 就 可 
以 了 ,而 不 必 改 动 软件 的 其 他 部 分 。 

4) 考 虑 到 如 图 10-14 所 示 交 直流 系统 的 特点 ， 在 进 了 直流 制 动 非 线性 校正 控制 系统 
的 数字 仿真 时 ,还 作 了 以 下 一 系列 近似 处 理 ， 

不 考虑 发 电机 调 速 器 的 作用 ,等 值 机 的 输入 功率 保持 不 变 ; 不 计 交 流 系统 发 生 大 扰动 
时 对 直流 系统 造成 的 影响 ;直流 线路 的 过 渡 过 程 中 ,直流 电压 UV 不 变 , 即 可 以 用 直流 电流 
代替 直流 功率 的 变化 情况 ; 仅 考虑 整流 侧 电 源 的 作用 , 道 变 侧 电源 保持 不 变 。 
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10. 3.3 直流 制 动 多 有 和 且 标 最 优 控制 方案 


直流 制 动 和 电阻 制 动 相 比 , 既 有 相似 的 地 方 ,又 有 自己 的 一 系列 特点 。 例 如 , 当 直 流 系 
统 双 极 平衡 运行 时 , 双 极 功率 可 互相 自动 补偿 ;具有 很 强 的 恒定 功率 控制 能 力 和 不 容 低估 
的 过 负荷 能 力 ; 快 速 的 调控 性 能 和 灵活 多 样 的 起 停 及 运行 方式 ,使 直流 制 动 可 以 实现 “三 
位 ”控制 , 即 在 振荡 周期 的 正 负 两 部 分 都 能 实现 制 动 , 且 易 于 实现 多 次 制 动 控 制 .为 了 充分 
发 挥 其 技术 优势 ,这 里 给 出 了 一 种 时 间 - 能 量 双 最 优 控制 方案 。 

最 优 控制 方法 是 根据 对 控制 系统 的 要 求 ,建立 相应 的 目标 函数 ,然后 用 数学 方法 研究 
其 实现 途径 。 因 此 ,如 何 建立 一 个 更 加 切合 实际 的 目标 函数 ,是 一 个 决策 性 的 问题 ,具有 更 
重要 的 意义 。 

为 了 分 析 的 简便 ,采用 如 下 二 阶 线 性 化 状态 方程 来 描述 图 10-14 所 示 的 交 直 流 电力 


系统 
=| 0 1 | 六 全 | 0 用 (10-28) 
Aw J [LoS'/T —D/T Aw w/T 2 


式 中 了 7 为 发 电机 转动 惯性 常数 ,单位 为 s;D 为 系统 的 阻尼 系数 标 乏 值 ;wo 为 额定 角速度 
(2xf0o);P。 为 发 电机 电磁 功率 的 标 么 值 :$。 为 同步 功率 系数 (S。=dP。./db= |E',| 为 常数 )， 
U 为 直流 功率 的 变化 量 APd, 令 a 二 D/2T ;ea 十 PB 二 woS'/T;K==w/T;Y,= Ap./S.;Y,= 


Aw, 则 式 (10-28) 变 为 
[x] “x (10-29) 


式 中 X1G() 二 BY1/K ;X(t)=aY /K+Y,/K, 
要 求 确定 一 个 U, 使 其 满足 如 下 条 件 : 
ZI 委 1， EL[o0,T) (10-30) 
在 U 的 控制 下 ,使 式 (10-29) 所 示 系 统 从 任意 状态 转移 到 原点 ， 且 使 性 能 指标 为 最 小 。 其 
性 能 指标 为 


=| [e+ Ue) 1 (10-31) 
式 中 p 为 加 权 系 数 , 当 p= 二 0 时 ,为 能 量 最 优 控制 ; 当 p=oo 时 ,为 时 间 最 优 控制 。 
该 问题 的 哈密 顿 嗓 数 为 
H=po+ UG) I++AGI BX,()— ADBK (FA UC (10-32) 
由 此 得 到 协 态 方程 
i=—9H/9X,= BA, 
{i J (10-33) 
其 通 解 为 
A1(t) = — Deos (Pt a,) 
pa (10-34) 


式 (10-34) 中 ,D 和 a 是 由 边界 条 件 所 确定 的 常数 。 
可 以 看 出 ,使 五 达到 最 小 的 条 件 为 
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U(#)=0, [4 C0) |<1 
UG)=—sgnd,(t), |14,0)|>1 
U(#)EL0,1], As(t)=—1 
U()E[—1,0], A,(t)=1 

可 以 证 明 , 其 最 优 控制 必 为 一 个 “三 位 ”控制 ,存在 如 下 六 种 组 合 形 式 ， 


[ 十 1 ， [0, 十 1j]， | 十 1,0, 一 1 |]， [一 1 ， [0 ,一 上 jj， [一 1,0, 十 1] 


(10-35) 


时 间 - 能 量 双 最 优 比 单纯 的 时 间 最 优 更 能 体现 对 直流 制 动 的 要 求 ,其 物理 意义 在 于 既 
要 使 系统 尽快 恢复 稳定 ,又 要 制 动 能 量 尽 可 能 少 。 显 然 , 将 式 (10-35) 直 接应 用 于 工程 实 
际 ,存在 着 一 系列 困难 ,需要 进行 次 最 优 及 简化 处 理 。 简化 后 所 得 的 开关 曲线 如 图 10-15 


所 示 。 即 最 优 控 制 律 为 


0， (Ai 和)ERUR， 
十 1， (AGEG 民 ， 
由 图 10-15, 可 设计 如 下 简化 判 据 ， 
一 1， Aw>K, 
-人 |Alw | 委 天 , 


十 1， Ad<< 一 天 


一 1]， (AX1, XER, 


式 中 天 ,根据 一 次 系统 及 控制 系统 参数 (p) 而 定 , 并 和 制 动 功率 大 小 有 关 。 


pp 


R, 办 | 


到; R, 


10-15 双 最 优 控制 的 简化 开关 曲线 


10. 3.4 最 优 直流 制 动 仿真 分 析 


(10-36) 


为 了 验证 这 种 简化 判 据 的 可 用 性 ,利用 前 述 的 模型 .方法 进行 了 仿真 计算 ,根据 计算 
结果 和 工程 实际 经 验 , 取 ,一 0.0008, 制 动 功率 |U| 二 0.4,K 点 发 生 三 相 短路 ,0. 5s 故 


障 切 除 1. Os 重合 闸 成 功 ,结果 如 下 。 


1) 双 最 优 控 制 方法 能 明显 地 改善 直流 输电 的 暂 态 响应 特性 , 特别 是 直流 电流 五 的 


有 反问 超 调 量 得 到 了 显著 的 抑制 ,如 图 10-16 所 示 。 


2) 相 比 于 动作 一 次 的 时 间 最 优 控制 方法 ,能 缩短 振荡 过 程 ,达到 提高 控制 效果 的 目 


的 ， 控制 效 果 的 功 角 曲线 ,如 图 10-17 所 示 。 


3) 相 比 于 动作 两 次 的 时 间 最 优 控制 方法 ,两 者 具有 十 分 相似 的 控制 效果 ,特别 是 在 


第 一 摇摆 周期 。 其 曲线 略 去 ，。 
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fis 


tis 


图 10-16 直流 输电 的 暂 态 响应 曲线 图 10-17 控制 效果 的 功 角 曲 线 
(图 中 虚线 为 纯 时 间 最 优 控 制 , 实 线 为 双 最 优 控制 ) (图 中 虚线 为 纯 时 间 最 优 控 制 , 实 线 为 双 最 优 控 制 ) 


10. 3.5 双 指 标 最 优 控制 的 优点 


最 优 控制 理论 应 用 于 直流 制 动 ,关键 在 于 如 何 选择 切合 实际 需要 的 目标 函数 。 本 节 介 
绍 的 直流 制 动 双 最 优 控制 方法 ,主要 有 如 下 特点 : 

1) 充分 利用 了 直流 系统 的 特点 ,利用 控制 措施 实现 非 线 性 补偿 ,从 而 减少 其 本 身 非 
线性 动态 特性 对 制 动 控 制 效果 的 影响 。 

2) 在 实现 暂 态 稳定 控制 的 前 提 下 ,能 减少 直流 电流 1 的 反 向 超 调 量 , 避 人 免 了 直流 制 
动 对 直流 输电 线路 本 身 的 影响 。 

3) 能 减少 对 两 侧 交 流 系统 的 冲击 ,降低 因 采 用 直流 制 动 而 导致 负面 效应 的 可 能 性 。 

4) 控制 方法 简单 适用 , 嫩 能 用 于 开 环 控制 ,也 易于 实现 闭环 控制 。 

为 充分 发 挥 直流 输电 的 效益 ,进一步 提高 直流 制 动 的 控制 效果 ,直流 制 动 的 概念 、 分 
析 和 控制 方法 有 答 于 进一步 研究 。 以 下 两 个 方面 的 工作 是 十 分 有 价值 的 。 

一 方面 ,直流 制 动 属于 交 直 流 联合 调节 的 范畴 ,因此 在 具体 实施 时 , 须 考虑 交 直 流 系 
统 的 相互 影响 程度 ,特别 是 动态 过 程 中 换 流 母 线 上 的 电压 稳定 性 ; 另 一 方面 ,如 果 在 快速 
调节 直流 功率 的 同时 ,对 换 流 站 的 无 功 功率 亦 进行 调节 ， 即 实 现 / 义 的 直流 制 动 ， 将 对 交 
流 侧 的 稳定 控制 起 更 大 的 作用 。 


“10.4 二 级 倒立 摆 的 二 次 型 最 优 控制 


二 级 倒立 摆 系 统 是 一 个 异常 复杂 而 又 对 准确 性 .快速 性 要 求 很 高 的 非 线 性 不 稳定 控 
制 系统 。 目 从 在 20 其 纪 60 年 代 后 期 ,作为 一 个 典型 的 不 稳定 严重 非 线 性 系统 的 例证 , 倒 
立 控 系统 的 概念 被 提 了 出 来 ,得 到 广泛 的 研究 。 

本 刷 针 对 二 级 倒立 摆 系 统 的 平衡 控制 问题 ,首先 对 二 级 倒立 摆 系 统 进行 建 模 ;并 设计 
了 两 种 控制 方法 一 一 线性 二 次 状态 控制 器 (LQR) 和 线性 二 次 输出 控制 器 (LQY); 最 后 根 
据 所 得 控制 策略 进行 了 仿真 ,对 所 获得 的 控制 结果 进行 了 对 比 研究 ,不 仅 从 理论 上 分 析 了 
两 种 方法 各 目的 优 缺 点 ,而 且 从 自 不 稳定 的 倒立 摆 实 际 控制 系统 中 进一步 证 实 了 各 方法 
的 控制 效 打 。 
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10. 4.1 系统 介绍 


倒立 摆 系 统 作为 一 种 控制 装置 , 它 结 构 简 单 .价格 低廉 ,便于 模拟 和 数字 实现 多 种 不 
同 的 控制 方法 ;作为 一 个 被 控 对 象 , 它 是 一 个 典型 的 高 阶 次 .多 变量 .严重 不 稳定 和 强 耦 合 
的 非 线 性 系统 ,只 有 采用 行 之 有 效 的 控制 策略 ,才能 使 其 稳定 。 因 此 ,在 稳定 性 控制 问题 
上 ,倒立 摆 具 有 普 忆 性 又 具有 典型 性 .倒立 摆 系 统 可 以 用 多 种 理论 和 方法 来 实现 其 稳定 控 
制 , 如 ND、 目 适应 .状态 反馈 .智能 控制 .模糊 控制 及 人 工 神经 元 网 络 等 ,都 能 在 倒立 摆 系 
统 控制 上 得 到 实现 ,而 且 当 一 种 新 的 控制 理论 和 方法 提出 以 后 ,在 不 能 用 理论 加 以 严格 证 
明 时 ,可 以 考虑 通过 倒立 摆 装 置 来 验证 其 正确 性 和 实用 性 。 
因此 ,倒立 摆 系 统 在 控制 系统 研究 中 受到 普遍 重视 ,已 被 公认 为 自动 控制 理论 中 的 典 
型 试验 设备 ,也 是 控制 理论 在 教学 和 科研 中 不 可 多 得 的 典型 物理 模型 .通过 对 倒立 摆 系 统 
的 研究 ,不仅 可 以 解决 控制 中 的 理论 问题 ,还 能 将 控制 理论 所 涉及 的 三 个 基础 学 科 :力学 、 
数学 和 电学 有 机 地 结合 起 来 ,在 倒立 摆 系统 中 进行 综合 应 用 。 近 代 机 械 控制 系统 中 ,如 直 
升 飞机 、 火 入 发 射 、 人 造 卫 星 运行 及 机 器 人 举重 物 、 做 体操 和 行走 机 器 人 步行 控制 等 ,都 存 
在 有 类 似 于 倒立 捍 的 稳定 控制 问题 。 
如 图 10-18 所 示 , 实 验 中 的 二 级 倒立 摆 系 
统 有 以 下 部 分 组 成 :有 效 长 度 为 90cm 的 光滑 
导轨 ,可 以 在 导轨 上 来 回 移动 的 小 车 ,材料 为 
铝 的 捍 杆 贸 接 在 小 车 上 ,二 级 摆 杆 以 同样 的 方 
式 与 一 级 舞 杆 相连 ,它们 的 铵 接 方式 决定 了 它 
们 在 竖 直 平面 运动 ,一 级 搜 杆 和 二 级 摆 杆 规格 
相同 ,有 效 长 度 为 525cm。 小 车 的 驱动 系统 由 
一 直流 力矩 伺 服 电 机 和 同步 带 传动 系统 组 成 ， 
小 车 相对 参考 点 ( 即 导轨 的 中 心 位置 ) 的 相对 
位 移 z 由 电位 器 和 测量 传动 带 而 得 到 ,一 级 摆 
杆 与 竖 直 方向 的 夹 角 0 由 固定 在 一 级 摆 杆 和 
小 车 匀 接 处 的 电位 器 1 测量 得 到 ,二 级 欣 杆 与 竖 直 方向 的 夹 角 0, 由 电位 器 通过 测量 两 个 
摆 的 角度 差 9, 一 9, 而 间接 得 到 。 直流 伺服 电机 产生 驱动 力 尺 使 小 车 根据 摆 角 的 变化 而 在 
导轨 上 运动 ,从 而 达到 二 级 倒立 摆 系 统 的 平衡 。 


10. 4. 2 二 级 倒立 摆 数 学 模型 的 建立 


为 了 进行 线性 控制 器 的 设计 ,首先 需要 对 被 控 系统 进行 建 模 。 二 级 倒立 摆 系 统 数学 模 
型 的 建立 基于 以 下 假设 : 

册 每 一 级 摆 杆 都 是 刚体 。 

已 在 实验 过 程 中 同步 带 长 度 保持 不 变 。 

号 驱动 力 与 放大 器 输入 成 正比 ,没有 延迟 直接 施加 于 小 车 。 

实验 过 程 中 的 库仑 摩擦 、 动 摩擦 等 所 有 摩擦 力 足 够 小 ,在 建 模 过 程 中 可 和 忽略 不 计 ， 

如 图 10-18 所 示 的 二 级 倒立 摆 系 统 ,根据 动力 学 理论 ,其 动力 学 方程 如 下 ， 


图 10-18 二 级 倒立 摆 系 统 


* 3o0。 


六 r 


M(0,,0,) 0 |=F(0,0,,61,6;) 101 |+N(0,0,) |0 | 十 GU (10-37) 


0, 6 , 0, 
式 中 
M+-M++M, (ML, + M,U)cost M,l,cost, 
M (0,,0,) = | (MU tM, ) cost 十 MT 二 AM M,Llcos(d,—0,) 
M,l,cosg, M,Ll,cos (0,—0.,) J ,Ml 


F(0,,0,,0,,0,) 


—F, (Ml + M,L)sing DO M,l,sin0, » 0 , 
一 | 0 — (FF, 二 +F,) M,L,lssin(0,—0)， 0,++F, 
0 — M,Ll,sin(0,—0,) 业 0 +-F， 一 有 ， 
0 0 0 Cr， 
NO0) 一 |0 Mili ML) gsing 0 ， G=|0 
0 0 M,l,gsing, 0 


式 中 各 参量 的 意义 及 参数 值 如 表 10-2 所 示 。 
表 10-2 ”二 级 倒立 摆 系 统 的 结构 参数 胡 


参 数 参 数值 意 义 
Mo 1. 3280 小 车 及 驱动 系统 的 等 效 质 量 (kg) 
Mi 0. 22 下 摆 质 量 (kg) 
M, 0. 187 上 摆 质 量 (kg) 
1 0. 004963 下 氛 转 动 惯 量 (kg * m?) 
J， 0. 004824 上 摆 转 动 惯量 (kg 。m?) 
Ll 0. 304 下 捍 质 心 至 轴 心 的 让 离 (m) 
12 0. 226 上 搜 质 心 至 轴 心 的 距离 (m) 
Li 0. 49 下 摆 轴 心 至 上 摆 辅 心 的 距离 (my) 
Fo 22. 915 小 车 系统 的 摩擦 系数 (N。m ，s) 
Fi 0. 00705 下 欣 摩 擦 阻力 系数 (N。m 。… s) 
F, 0. 00264 上 欣 摩 擦 阻 力 系数 (N。，m。 s) 
Go 11. 887 力 与 控制 电压 之 比 (N/V) 


在 平衡 点 9 一 0, 一 0 和 6 一 6, 二 0 附近 对 方程 (10-37) 进 行 线性 化 处 理 , 亦 即 设 sing 
人 0 ,cos9 之 1 ,得 


r 7 r 
M(0,0) | |=F(0,0,0,0) 101|+N(0,0)10 | 二 GU (10-38) 
0, 5 0, 
式 中 
M+M+M, ML+M!, M,l, 
M(0,0)= | MO 十 AM 由 十 MO 十 AM M,Ll; 
M ,ls MiLl, 7; Ms 
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roooo-| 0 — (Fi 二 EF,) F,， 
0 F, —F,， 


0 0 0 
wom- (AI 十 MB 0 | 
0 0 M,l,g 

X=[z: ze zs ze xs zel'=[r 0 (0.—0) 1+ 0 (0 一 0 本 

Y=|ix, xz xi|=|r 0 0 一 0 

那么 根据 (10- 38) ,并 作 适 当 变 换 得 系统 的 状态 方程 为 

X=AX+BU 
yex 


(10-39) 


式 中 


1 0 0 

03xs ;xs O03x3 
A= B= ’ C=[]1,; 0,x3 | 9 0 一 0 1 0 
A, ' A,, B, 0 1 1 


4 一 7 了 47 一 NT ， 4 一 7 了 ,有 FT,'， B,=ToM 'G 
对 连续 系统 (10-39) 进 行 离散 化 处 理 , 可 得 离散 化 后 的 系统 的 状态 方程 为 
和 =~GA,T+ HU, 
Y,—CX, 


(10-40) 


式 中 G 二 e*7', 夺 二 | ‘e479Bdi,T, 为 采样 周期 ,实验 中 取 7,==0. 02s 


10. 4.3 最 优 控 制 算法 设计 


本 节 所 介绍 的 两 种 控制 器 都 需要 用 到 系统 状态 的 全 反馈 ,而 实际 系统 中 直接 可 测 的 
状态 只 有 小 车 位 置 和 倒立 摆 的 位 置 。 一 种 方法 是 通过 采用 状态 观测 器 来 得 到 小 车 以 及 倒 
立 捍 的 速度 ,实际 上 对 于 倒立 摆 系 统 而 言 ,虽然 不 能 直接 测量 小 车 以 及 倒立 摆 的 速度 ,但 
是 可 以 很 容易 地 通过 对 直接 可 测 的 小 车 位 置 和 倒立 控 位 置 的 线性 差分 得 到 ,这 样 , 在 进行 
状态 反馈 控制 时 ,就 不 需要 再 设计 状态 观测 器 了 。 

线性 二 次 型 控制 理论 已 成 为 反馈 系统 设计 的 一 种 重要 工具 。 其 特点 是 : 它 为 多 变量 反 
馈 系 统 的 设计 提供 了 一 种 有 效 的 分 析 方 法 ; 它 可 以 适应 于 时 变 系统 ; 它 可 以 处 理 扰动 信号 
和 测量 噪声 问题 ; 它 可 以 处 理 有 限 和 无 限 的 时 间 区 间 。 

(1) 线 性 二 次 状态 控制 器 (LQR ) 

设 状态 反馈 调节 律 的 形式 为 U(4)== 一 K.X(k) ,通过 使 性 能 指标 函数 (10-41) 为 最 小 ， 
可 求 得 式 (10-42) 所 示 的 状态 反馈 增益 阵 


J .= 2 [XT CROKREY SUT EI RU CE)] (10-41) 
K,= (HI'SH+R.) -HTSG) / (10-42) 
并 中 S 由 下 列 黎 卡 提 方程 获得 : 


DLL， 


G'SG—G'SH(H'SH+R.) 'H SG 十 OO 一 (10-43) 

0, 和 R, 为 权 和 矩阵 ,分 别 用 来 对 状态 向 量 生 (8) 控制 量 U(%) 引 起 的 性 能 度量 的 相对 重要 
性 进行 加 权 。 在 系统 的 仿真 控制 过 程 中 , 取 @.=1.6X1xe,R. 二 0.8。 根 据 式 (10-42) 和 
式 (10-43) 设 计 出 状态 反馈 矩阵 为 

K,—={0.0245 0.3737 1.3312 一 0.0018 0.1858 0.1941 

对 二 级 倒立 摆 系 统 进行 状态 反馈 控制 , 取 初 值 

X=[0 (15/180)r (10/180)r 0 0 0 
仿真 控制 可 得 小 车 位 置 轨迹 和 倒立 摆 上 、 下 摆 角 度 轨迹 以 及 控制 输出 曲线 如 图 10-19 中 
实 线 所 示 。 从 仿真 曲线 可 以 看 出 ,R 控制 器 对 于 不 稳定 倒立 摆 系 统 的 控制 是 很 有 效 的 。 其 
中 , 实 线 表示 R 控制 时 的 情况 ,虚线 表示 了 控制 时 的 情 沈 。 


小 车 亿 置 上 探 角 度 


图 10-19 LQR 与 LQY 控制 仿真 曲线 
(2) 线 性 二 次 输出 控制 器 (LQY) 
设 输出 反馈 调节 律 的 形式 为 DC) 一 一 开 , 于 (RE) ,此 时 可 通过 使 性 能 指标 函数 (10-44) 
为 最 小 ,可 求 得 式 (10-45) 状 态 反馈 增益 向 量 


了 一 2 [YT COR)QY Ck) FUT CR) RU Ck) (10-44) 
K,=(H'SH+R,) '(H'SG) (10-45) 

式 中 S 由 下 列 黎 卡 提 方程 获得 ， 
G SG—G SH(H'SHT+R,)H'SG+C O0,C=S (10-46) 


0O, 和 R, 为 权 和 矩阵 ,分 别 用 来 对 输出 向 量 Y(4) 控制 量 UG) 引 起 的 性 能 度量 的 相对 重要 
性 进行 加 权 。 在 系统 的 仿真 控制 过 程 中 , 取 0, 二 5X1xs,R, 一 0.6, 根 据 式 (10-45) 和 和 
式 (10-46) ,设计 状态 反馈 增益 矩阵 为 
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K,=[1.0121 4.5728 6.3652 0.9117 1.5246 0.9989 
对 二 级 倒立 摆 系 统 进行 状态 反馈 控制 , 取 初 值 
于 ,二 [0 (15/180)x (10/l80)x 0 0 0 

仿真 控制 可 得 小 车 位 置 轨迹 和 倒立 欣 上 、 下 所 角 上 度 轨 迹 以 及 控制 输出 曲线 。 如 图 10-19 中 
虚线 所 示 , 从 仿真 曲线 可 以 看 出 ,LQY 控制 器 对 于 不 稳定 倒立 捍 系 统 的 控制 也 是 有 效 的 。 

从 两 种 控制 仑 的 仿真 结果 来 看 ,LQY 控制 姻 具有 较 优 的 鲁 棱 性 及 瞬 态 特性 ,LQR 控 
制 磊 的 鲁 棱 性 及 瞬 态 特性 较 差 ;但 是 LQR 控制 器 具有 较 优 的 稳 态 特性 ,LQY 较 差 。 这 是 
因为 LQY 控制 如 重 点 考虑 r.9、9, 在 UU 控制 下 的 变化 规律 ,而 LQR 则 综合 考虑 0,、9,、 


,01、0; 在 U 控制 下 的 规律 ,从 而 LQR 控制 器 的 稳 态 效果 较 好 ,但 是 牺牲 了 系统 的 鲁 棒 
性 。 综 上 所 述 ,LQY 控制 器 相对 较 优 。 


10. 4.4 系统 实现 


随 着 现代 工业 的 要 求 和 微 电 子 技术 的 进步 ,一 种 体积 更 小 .运算 速度 更 快 .功能 更 强 
大 的 数字 信和 号 处 理 器 DSP 应 运 而 生 ,并 且 迅 速 而 广泛 地 运用 于 数据 处 理 、. 语 音 识别 、 视 觉 
处 理 . 运 动 控 制 等 数据 量 多 、 运 算 速 度 要 求 高 和 实时 性 强 的 系统 。 由 于 DSP 这 些 优点 ,可 
以 将 DSP 应 用 到 倒立 摆 系 统 的 控制 中 ,设计 了 基于 DSP 的 二 轮 小 车 -倒立 摆 系 统 。 比 起 
台式 倒立 摆 , 它 有 更 多 的 运动 自由 度 , 并 可 以 脱离 计算 机 独立 工作 ,实现 更 多 .实时 性 更 好 
的 控制 功能 ,更 方便 地 加 入 附加 功能 .扩展 性 强 等 特点 。 

图 10-20 所 示 为 二 级 倒立 摆 系 统 的 控制 原理 框图 。 


Ap 三 控制 器 DSP D/A 


a | 


2 4 
' 


检测 元 件 1 


] 
( 合 服 电机 


图 10-20 ”二 级 倒立 摆 系 统 的 控制 原理 框图 


(1) 控 制 器 的 硬件 设计 

考虑 到 小 车 -倒立 摆 系 统 测量 值 多 、 程 序 大 、 扩 展 功 能 多 的 特点 和 实时 性 强 的 控制 要 
求 , 在 控制 器 的 设计 中 ,选用 美国 TI 公司 生产 的 TMS320IY2407DSP 芯片 ,因为 该 芯片 
不 仅 处 理 速 度 快 、 操 控 灵 活 ,而 且 拥 有 丰富 的 片 内 资源 :包括 10 位 16 通道 片 内 A/D 转换 
器 、 两 个 事件 管理 器 模块 EVA 和 EVB, 分 别 具 有 两 个 通用 定时 器 .3 个 比较 单元 和 8 路 
PWM 输出 、 同 步 串 口 和 异步 串口 ,以 及 CAN 模块 等 片 内 外 设 .6 个 8 位 标准 1/O 口 大 
容量 片 内 存储 器 、 多 种 外 围 器 件 接 口 .可 以 说 该 芯片 将 实时 处 理 能 力 和 外 设 控 制 功能 集 于 
一 身 ,使 之 特别 适用 于 本 小 车 -倒立 摆 系 统 。 

以 该 芯片 为 核心 ,结合 其 他 外 围 芯片 ,包括 Allegro 公司 生产 的 全 桥 式 PWM 电机 驱 


ET 
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动 芯片 A3952SB,MAXIM 公司 生产 的 SMITH 式 脉 宽 调 制 DC-DC 降 压 芯片 MAX831， 
24V 转 5V 电压 转换 模块 SF5W,5V 转 3.3V 电压 转换 芯片 AS1117,3V 精准 电压 芯片 
REF193,64K 高 速 外 接 存储 器 IS61LV6414 及 SCHMITT 触发 器 CD40OIO6B 等 构建 了 
小 车 -倒立 摆 系 统 的 外 围 电 路 。 运 用 计算 机 辅助 电路 设计 软件 PROTELSE99 完成 整个 控 
制 板 的 设计 ,实现 了 小 车 -倒立 摆 的 硬件 系统 。 控 制 板 的 相关 功能 说 明 如 图 10-21 所 示 。 


24V [| SF5W | 为 外 转 芯 片 
MAX831 AS1117 


Vv 
[14 FA [pso106F A QEP12 一 |A3952SBH| 证 机 


摆 杆 1 玫 陀 蜡 仪 > 分 压 计 A/IO ”TMS2407 
摆 杆 2 上 陀螺 仪 F>[ 分 庄 计 瞩 10 


图 10-21 硬件 功能 说 明 图 


(2) 控 制 器 的 软件 设计 
控制 锻 的 软件 设计 采用 的 是 TI 公司 提供 的 CCS 软件 开发 系统 。 使 用 循环 周期 中 断 


触发 机 制 对 系统 进行 高 度 实 时 的 控制 ,每 个 周期 中 完成 了 对 输入 的 模拟 信号 的 软件 滤波 ， 
实时 计算 反馈 向 量 及 给 出 控制 量 , 实 现 反馈 控制 ,其 程序 流程 图 如 图 10-22 所 示 ， 


采样 输入 
UU 


计算 所 需 状 态 变量 


10-22 软件 流程 图 


二 级 倒立 摆 的 控制 目标 就 是 使 倒立 摆 在 不 稳定 的 平衡 点 附近 的 运动 成 为 一 个 稳定 的 运 
动 ,控制 夹 角 9、9, 和 位 置 7 在 各 自 的 位 置 零点 附近 变化 ,而 整个 摆 处 于 垂直 状态 ,整个 过 
程 是 一 个 动态 平衡 过 程 ,在 实际 系统 中 想 使 摆 静 止 直立 在 平衡 位 置 是 很 难 办 到 的 ,只 能 是 


在 平衡 位 置 处 的 振荡 , 即 系 统 存在 误差 。 
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10.5 电动 公交 车 直流 牵引 电动 机 驱动 系统 最 优 控制 


发 展 电动 汽车 产业 能 改善 空气 质量 .节省 宝贵 的 石油 资源 ,符合 我 国 的 可 持续 发 展 战 
略 决 保 。 电 动 汽车 的 研究 开发 .试制 生产 、 运 行 示范 .推广 应 用 .基础 设施 建设 等 是 一 项 完 
整 的 系统 工程 ,对 优 进 我 国 国民 经 济 的 发 展 具 有 深远 的 意义 ,是 一 件 利 国 利 民 的 伟大 事 
业 。 为 此 ,国家 已 经 把 电动 汽车 及 其 重要 部 件 的 研究 开发 列 入 了 “十 五 ”863 计划 中 12 个 
重大 研究 专项 之 一 ,而 电动 汽车 驱动 系统 是 电动 汽车 的 重要 部 件 , 因 此 利用 最 优 控制 的 原 
理 设计 并 制造 电动 公交 客车 的 驱动 系统 是 非常 有 意义 的 。 

本 太 讨 论 了 电动 公交 车 直流 牵引 电动 机 驱动 系统 的 最 优 控制 问题 。 首 先 建立 了 永 磁 加 增 
磁 复 合 励磁 电动 机 驱动 控制 系统 的 数学 模型 ,接着 应 用 线性 二 次 型 性 能 指标 最 优 控制 方法 , 设 
计 了 电动 公交 大 客车 加 速度 控制 系统 的 控制 参数 ,最 后 进行 了 计算 仿真 。 结 果 表 明 该 驱动 控制 
系统 具有 抗 干扰 能 力 强调 节 特 性 快速 .平稳 等 优点 ,能 很 好 地 满足 实际 要 求 。 


10. 5.1 系统 介绍 


目前 ,电动 汽车 所 使 用 的 直流 电动 机 有 三 种 :他 励 直流 电动 机 (包括 永 磁 直流 电动 
机 )、 串 励 直流 电动 机 .复合 励磁 的 直流 电动 机 。 他 励 直 流 电 动机 不 能 满足 电动 汽车 起 动 、 
加 速 的 大 扭矩 要 求 , 串 励 直 流 电 动机 弥补 了 这 一 点 的 不 足 , 但 效率 低 , 且 难 于 有 效 实现 电 
动 汽车 的 再 生 制 动 要 求 , 即 使 通过 复杂 的 控制 能 勉强 实现 再 生 制 动 , 制 动 稳定 性 也 不 好 ， 
可 靠 性 也 较 差 。 因 此 ,电动 汽车 在 使 用 直流 电动 机 作为 牵引 电动 机 时 ,最 好 用 他 励 加 增 磁 一 
绕组 的 复合 励磁 的 直流 电动 机 ,为 了 提高 效率 ,他 励 部 分 最 好 选用 钴 铁 硼 等 高 磁 材 料 构成 
的 永 磁 磁极 。 

当今 ,许多 使 用 直流 电动 机 的 电动 车 辆 大 多 采用 串 励 电 动机 或 他 励 电 动机 ,所 用 的 电 
动机 控制 器 也 是 针对 捉 励 电动 机 或 他 励 电 动机 设计 的 。 国 内 某 单 位 在 电动 大 客车 上 采用 
了 永 磁 和 增 磁 绕组 结合 的 复合 励磁 的 直流 电动 机 作为 牵引 电动 机 ,但 所 设计 的 控制 器 对 
增 磁 绕组 的 控制 ,只 是 采用 了 在 车 辆 需要 大 扭矩 驱动 时 把 增 磁 绕组 通过 接触 器 闭合 通电 
的 简单 增 磁 方法 ,实际 上 是 把 增 磁 绕 组 当 作 并 励 绕 组 使 用 ,这 样 无 法 实现 电动 汽车 由 低速 
到 高 速 起 动 过 程 中 的 自动 弱 磁 ,控制 起 来 十 分 不 便 。 而 且 , 由 于 使 用 了 接触 器 这 类 的 有 触 
点 开关 ,可靠 性 也 降低 了 。 

针对 上 述 直 流 电动 机 控制 器 的 不 足 , 给 出 一 种 根据 电动 汽车 驱动 特性 要 求 对 永 磁 加 
增 磁 绕组 复合 励磁 的 直流 电动 机 进行 合理 控制 的 电动 机 驱动 系统 。 该 电动 机 驱动 系统 把 
电动 机 的 增 磁 绕 组 接 在 电动 机 控制 系统 的 续 流 回路 中 ,产生 了 全 新 的 自动 弱 磁 调 速 方案 ， 
使 得 电动 机 驱动 系统 能 很 好 地 满足 电动 汽车 大 扭矩 起 动 和 高 速 运行 时 ,电动 机 需要 花 磁 
调 速 的 特性 要 求 。 


10. $5.2 电动 机 控制 系统 工作 原理 


电动 公交 大 客车 驱动 电动 机 控制 系统 简化 原理 如 图 10-23 所 示 。 系统 中 ,各 组 成 部 分 
功能 如 下 ;电池 组 B 是 384V ,为 驱动 系统 提供 动力 ;直流 电动 机 SM 为 公交 车 的 驱动 电动 
机 , 它 是 市 有 水 磁 加 增 磁 绕组 复合 励磁 方式 的 新 型 牵引 电动 机 ,包括 电 枢 绕组 A 、 增 磁 励 
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图 10-23 电动 公交 大 客车 驱动 电动 机 控制 系统 原理 图 


位 绕组 LL 、 永 磁 励 磁 绕 组 Li;Ui 为 以 IGBT; 为 主体 的 功率 智能 模块 ;VD .CR 组 成 其 
浪 涌 电压 吸收 保护 电路 ;VD;, 为 装 在 模块 内 的 反 疝 保护 二 极 管 ;IGBT, 工作 在 高 频 脉 冲 
调 宽 状态 ,其 载波 电压 控制 驱动 电动 机 转速 ;U; 为 以 IGBT,; 为 主体 的 功率 智能 控制 模 
块 ;VD,;、C;、R; 组 成 其 浪 涌 电压 吸收 保护 电路 ;VD 为 装 在 智能 模块 内 的 反 回 保护 二 极 
管 ,调节 IGBT; 的 导 通 脉冲 宽度 ,可 以 改变 再 生 电 流 , 以 控制 驱动 电动 机 (和 车辆) 制 动 ;U。 
为 电流 传感器 检测 模块 ,用 于 功率 模块 过 流 保 护 ; 电 流传 感 硕 模块 Us 用 于 测量 驱动 电动 
机 电 枢 电流 i,;VD。 为 再 生 制 动 通路 二 极 管 模块 ;Rs CVD; 组 成 其 浪 涌 电压 吸收 保护 电 
路 。 加 速度 信号 来 自 加 速度 踏板 , 制 动 信 号 来 自制 动 踏板 ,控制 单元 是 以 单片机 为 核心 的 
电子 线路 。 工 作 时 , 接 通 电源 开关 ,控制 单元 检测 来 和 目 加 速 踏板 的 加 速度 信号 和 来 目 电流 
传感器 Us 的 电 枢 电流 2 如果? 小 于 加 速度 给 定 值 , 则 增加 ICBT; 的 高 频 脉 冲 宽 度 ,使 
加 在 电 枢 两 端的 电压 zx 上 升 和 zi 增加 ,电动 机 SM 加 速 ; 皮 之 ,如 果 z 大 于 加 速度 的 给 定 
值 , 则 减 小 IGBT;, 的 脉冲 宽度 ,使 下降 和 i 减 小 ,电动 机 SM 减速 。 在 这 一 过 程 中 ， 
IGBT: 始 终 关 断 。 当 电动 机 (车 辆 ) 制 动 时 ,加 速度 信号 为 零 ,并且 IGBT, 关 断 ,控制 单元 接 
受制 动 信号 ,并 向 IGBT; 发 出 相应 的 胀 冲 调 宽 信 号 ,IGBT; 导 通 ,电动 机 SM 的 反 电 势 通 
过 IGBT。 和 VD。 导 通 或 者 通过 VD; 及 电池 B 导 通 构成 回路 ,从 而 实现 驱动 电动 机 的 再 
生 制 动 。 

加 在 电动 机 电 枢 绕组 的 电压 zx. 为 高 频 脉冲 调 宽 形式 。. 当 IGBT, 导 通 时 ,i, 通过 电 枢 
绕组 A 流 回 电池 组 B 的 负极 ; 当 IGBT, 关 断 时 , 电 枢 电流 i 经 过 电 枢 绕组 A 、 增 磁 绕 组 
Li 和 和 反问 二 极 管 VD, 构成 续 流 通路 。 在 续 流 过 程 中 , 增 磁 绕 组 产生 的 磁场 与 永 磁 磁场 一 
致 ,从 而 达到 增 磁 的 目的 。 妆 公交 车 处 在 起 动 或 想 坡 低速 运行 时 ,由 于 电 枢 反 电 势 天 小 ， 
要 达到 与 加 速度 踏板 信号 对 应 的 电流 全,IGBT; 的 导 通 角 很 小 , 即 IGBTi 的 关 断 时 间 
或 电 枢 绕组 的 续 流 时 间 长 ,使 得 增 磁 绕组 Li 中 有 大 的 续 流 电流 和 增 伍 ,电动 机 产生 足够 
大 的 驱动 转 矩 输出 ,因此 增 磁 电动 机 有 比 普通 并 励 电 动机 更 大 的 起 动 转 矩 和 扑 坡 能 力 .经 
测定 , 增 磁 电 动机 的 转 矩 -转速 特性 曲线 ( 实 线 ) 示 于 图 10-24, 其 中 还 示 出 同一 电动 机 在 无 
增 磁 时 的 部 分 转 矩 -转速 特性 曲线 (虚线 ) ,比较 其 中 实 线 和 虚线 可 知 , 带 有 增 磁 绕 组 的 电 
动机 与 同 功 率 的 并 励 电 动机 相 比 ,两 曲线 相似 ,但 在 相同 电 枢 电 流 i 的 情况 下 , 低 转速 时 
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输出 转 矩 大 为 增加 ,而 在 高 速 运行 时 ,其 输出 转 矩 接近 。 


1.i,=300A 
2.1=250A 
3.5=200A 


4.1.=150A 
全 000 $i=100A 
之 500 6.i,=50A 
忆 400 
这 
300 
200 


0 SO0 1000 1500 2000 24300 
轰 速 n/(r/min) 


图 10-24 增 磁 电动 机 转 知 -转速 特性 


10. 5.3 驱动 电机 的 数学 模型 


(1) 普 通 并 励 电 动机 结构 图 及 传递 函数 
普通 并 励 电动 机 满足 下 述 微分 方程 : 
1) 电 枢 电 压 - 电 流 特性 
La di Rs 一 2 一 瓦 (10-47) 
式 中 为 电动 机 电 枢 端 电 压 ;L, 为 电动 机 电 枢 绕组 电感 ;i, 为 电动 机 电 枢 电流 ;R。 为 电 
动机 电 枢 绕组 电阻 ;E 为 电动 机 转动 时 反 电 势 。 
2) 电 枢 电 流 - 转 矩 特 性 
M=C,® i, = kni, (10-48) 
式 中 有 MY 为 电动 机 电磁 转 矩 ;Cs 为 转 矩 常数 ,由 电动 机 结构 确定 ;@ 为 电动 机 励磁 磁 通 ; 
& 一 Cu5。 
3) 电 动机 转动 时 反 电 势 
下 一 Cn 一 Ra (10-49 ) 
式 中 E 为 电动 机 感应 反 电 势 ;C。 为 电动 势 常数 ,由 电动 机 结构 而 定 jx 为 电动 机 转速 
(r/min);k.=C.®, 
4) 转 和 矩 - 加 速度 特性 
太史 一 M 一 Mi | (10-50) 
式 中 J 为 电动 机 转子 和 汽车 运动 时 折算 到 电动 机 轴 上 的 转动 惯量 之 和 ;w 为 电动 机 转动 
角速度 ,w= 二 (2x/60)n 或 2 一 (60/2r)wjah 为 电动 汽车 各 种 负载 转 矩 之 和 。， 
令 二 1/R,,T,= 二 LL,/R,, 根 据 式 (10-47) 至 式 (10-50)， 并 取 拉 普 拉 斯 变换 ,可 得 wm 对 
n 的 结构 图 ,如 图 10-25 所 示 。 
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图 10-25 ”驱动 电动 机 (无 增 磁 ) 绪 构图 


(2) 加 增 磁 电动 机 的 结构 图 及 传递 栅 数 
图 10-24( 实 线 ) 示 出 永 磁 加 增 磁 电 动机 的 转 矩 -转速 特性 ,可 以 看 出 转 矩 M 是 电 枢 电 
流 i,。 和 转速 ”的 双 变 量 非 线性 一 数 , 即 


M= (1,,n) (10-51) 
奉 在 工作 点 线性 化 ,可 得 其 增 量 方程 
AM 二 27 Ce Ai 十 97 ta An (10-52) 
9 a (i070) dn (iao ynao1 
2 ;72 ) , . : 
式 中 一 一 一 为 函数 荆 (i,n) 在 训 王 iw 和 nm 处 必 对 i 的 偏 导 数 ; 
sa 为 图 数 (i,,n) 在 1 一 7ao 利 了 2 一 120 处 MM 对 n 的 偏 导数 ;AM 为 M 在 (io 和 和 
(tao0s*a0 
2o) 处 的 增 量 ;Ai。 为 z。 在 1 处 的 增 量 ;An 为 天 在 Ho 处 的 增 量 。 
作 
S 
p= (10-53) 
a (G10:n0) 
ka — LCs) (10-54) 
. n Gon0) 
则 式 (10-52) 可 写成 
AM= kiAi, 二 kn An (10-55) 


式 中 如 和 &m 可 根据 式 (10-53) 和 式 (10-54) 的 定义 在 图 10-24 中 用 图 解法 计算 ,其 中 台 
的 含义 是 当 i, 增加 1A 时 M 增加 的 转 矩 (N。m) ,而 kw 是 M-n 曲线 的 斜率 ,Au 为 负数 ， 
即 当 转速 增加 1r/min 时 转移 M 的 增加 数 (N，m)。 

考虑 到 式 (10-55) 和 图 10-25, 增 磁 电 动机 的 线性 化 结构 图 如 图 10-26 所 示 ,图 中 省 略 
了 了 增 量 符号 “A”。 


图 10-26 带 有 增 磁 绕组 的 驱动 电动 机 结构 图 
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可 以 看 出 ,图 10-26 中 心 代 之 图 10-25 中 的 如 ,同时 增加 Am。 的 电动 机 转速 反馈 回 
路 。 必 是 非 线 性 参量 ,观察 图 10-24 中 的 转 矩 -转速 特性 ,显然 有 妃 宇 ks, 且 随 转速 的 下 
降 ,及 = 比 &, 增加 很 多 ;而 km 也 是 非 线 性 参量 , 它 是 图 10-24 曲线 ( 实 线 ) 的 斜率 , 随 转速 
的 增加 ,其 绝对 值 逐 渐 减 小 ;由 于 增 磁 作用 ,励磁 磁 通 随 变化 ,所 以 &. 也 是 非 线 性 参量 。 

3) 电动 公 区 车 加 速度 控制 系统 的 结构 图 和 传递 函数 

图 10-23 中 ,控制 副 以 加 速度 信号 为 
输 人 ,以 来 目 电 枢 电 流传 感 莫 的 信号 为 反 
馈 , 根 据 其 差 值 调节 IGBT, 输出 的 脉冲 宽 
度 ,IGBT, 的 输出 为 电动 机 电 枢 电压 w,,w。 
控制 电 枢 电 流 i,, 这 样 形成 电流 i.( 电 动机 

图 10-27 ”加 速度 控制 系统 仿真 图 加 速度 ) 的 闭环 控制 系统 。 如 图 10-27 
所 示 。 

图 中 ,积分 能 是 为 提高 稳 态 精度 男 加 的 环节 ;电动 机 电 枢 绕组 的 R,、L 构成 电磁 惯 
性 ,T, 二 上 ,/R,,k, 是 电 枢 绕组 的 电流 增益 ,二 1/R,;IGBTi 保护 电路 中 的 RC 和 电流 传 
感 兰 中 的 RC 也 形成 惯性 ,用 7 表示 ;k. 是 电流 传感器 电压 -电流 比例 系数 。 参 数 选 择 和 
计算 如 下 。 

取 一 251. 12s ,由 驱动 电动 机 参数 知 L, 一 5mH,R,。 二 0.03835Q, 故 k= 1/R,= 
1/0. 03835 二 26;T, 一 上 L,/R, 二 5X10 /0. 03835= 二 0. 13s; 保 护 电 路 及 滤波 器 的 时 间 常 数 估 
算 为 工 ,一 0.02s, 当 i 二 300A 时 ,电流 传感器 输出 电压 为 5V , 故 和 =5/300 二 0.0167V/A.， 

其 闭环 传递 函数 为 


_ 1,(s) k, Xk, 
ITD TT TT HT Ts hk (10-56) 
代入 参数 值得 
B= -25.12x26 
U.(s) s(0.13s+1)(C0.02s+1)+93.21 
5592. 6 215100 | 


”0. 002653 十 0. 1553 十 s 十 93.21 5 +57. 6992 二 384 6 二 35850 
10-28 所 示 为 根据 式 (10-57) 画 出 系统 仿真 图 。 


u=u X) 1 | {|x 一 站 
一 一 
37.69 
384.6 


图 10-28 加 速度 (i,) 控 制 系统 仿真 图 
根据 图 10-28, 写 出 其 可 控 规范 型 状态 方程 如 下 : 


1 一 7 TX; = Ts 


:二 一 35850z1 一 384. 6Xx,— 57. 69z3 十 &， yy 一 2 上 1510007 
”360。 


或 写成 


| (10-58) 
y=C, 
0 1 0 0 
式 中 4 二 0 0 1 ,B= ， ,CC 一 [2151000 0 0]。 
一 35850 一 384.6 一 57. 69 1 
10. 5.4 最 优 控制 系统 设计 
(1) 加 速度 控制 系统 的 稳定 性 分 析 
根据 和 矩阵 4 应 用 Matlab 程序 , 求 出 其 特征 值 , 即 闭环 系统 特征 根 为 
r=—61. 2405 
| 6402 十 j24. 1393 (10-59) 
r3=1. 6402 一 j24. 1393 
因此 在 状态 反馈 之 前 ,加 速度 控制 系统 是 不 稳定 的 。 
《2) 线 性 二 次 型 性 能 指标 最 优 控制 器 设计 
线性 二 次 型 性 能 指标 为 
J 一 | (x'Qx+uTRu) dt (10-60) 
1 0 0 
“1) 阁 取 Q=10 1 0|,R=1, 应 用 Matlab 程序 求 得 状态 反馈 系数 为 
0 0 1 
大 一 [有 k, kj=[0 47.2643 6. 6813] (10-61) 
黎 卡 提 方 程 解 为 
1.4600 0.0240 0 
P= |0.0240 0.0029 01X107 (10-62) 
0 0 0 
闭环 系统 特征 根 为 
ri 二 一 061. 0236 
人 一 1. 6738 十 j24. 1801 (10-63 ) 
73 一 一 1.6738 一 )24. 1801 
1 0 0 
2) 厅 取 Q==10 1 0 | ,R= 二 1, 应 用 Matlab 程序 求 得 状态 反馈 系数 为 
0 0 10000 
k=[k! k, ksj=[0 1943.4 73.5] . (10-64) 
黎 卡 提 方 程 解 为 
6. 9669 0. 2636 0 
P 一 |0.2636 0.0283 0.0002|X10’ (10-65) 
0 0. 0002 0 
闭环 系统 特征 根 为 


“” 361 。 


71 一 一 1]13. 4 
| 87 十 ]15. 41 (10-66) 
rs 二 一 8.87 一 ]15. 41 


] 0 0 
3) 若 Q= 1 0 | ,R==1, 应 用 Matlab 程序 求 得 状态 反馈 系数 为 
0 0 100000 
k=[k, k, k;|=[0 4082.3 276. 2 | (10-67) 
黎 卡 提 方 程 解 为 
1.4635 0.0990 0 
P= 10.0990 0.0147 0|X10: (10-68) 
0 0 0 / 
闭环 系统 特征 根 为 
rr 二 一 320.3] 
" 一 6. 80 十 ]8. 11 (10-69) 
”一 一 6.80 一 ]8. 11 


10. 5.5 系统 特性 仿真 分 析 


状态 反馈 后 的 系统 仿真 如 图 10-29 所 示 。 其 对 应 的 闭环 传递 函数 为 


_LG) / 215100 
D(H BT 69 4h a8 6 十 有 及 二 (35850 直 有) “1070) 


一 | % ] 区 2 1 = 
Hu 3 和 p=Ia 


图 10-29 ” 带 状 态 反 馈 的 加 速度 控制 系统 仿真 图 


对 式 《10-70) 分 别 代 入 三 种 不 同 Q、R 及 计算 所 得 的 & 一 [Le ，A kj] 值 ,应 用 Matlab 
软件 ,可 得 其 单位 阶 跃 响应 曲线 ,如 图 10-30 所 示 。 比较 其 中 三 条 曲线 ,可 知 曲 线 @ 的 超 调 
量 较 小 ,比较 满意 , 故 取 二 0,k, 一 4082. 3,k; 二 276. 2。 

本 节 介 绍 的 直流 牵引 电动 机 驱动 系统 的 最 优 控 制 方法 ,主要 有 如 下 特点 : 

1) 驱动 电动 机 增加 激 磁 励磁 绕组 以 后 ,改善 了 低速 转 矩 -转速 特性 ,而 且 这 一 特性 是 
非 线 性 的 ,在 做 系统 分 析 时 ,应 对 不 同 的 工作 点 分 别 进 行 计 算 。 

2) 应 用 线性 二 次 型 性 能 指标 ,设计 了 加 速度 (电流 i,) 控 制 系统 ,所 设计 的 系统 改善 
了 稳定 性 ,并 有 较 好 的 过 渡 过 程 指标 ,实验 结果 与 设计 相符 。 

3) 实现 状态 反馈 有 多 种 方法 ,其 中 方法 之 一 是 应 用 输出 量 Gi,) 及 其 一 次 微分 、 二 次 微 
分 来 获得 ,本 控制 项 正 是 这 样 。 

4) 本 加 速度 控制 实际 上 是 对 电流 i 的 控制 ,而 不 是 对 电动 机 转 插 或 加 速度 的 控制 。 
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图 10-30 ”三 种 状态 反馈 参数 下 的 单位 阶 跃 啊 应 


由 于 转 和 矩 -转速 的 非 线性 特性 ,真实 的 加 速度 控制 在 低速 (起 动 ) 阶 段 更 灵敏 ,其 阶 牙 啊 应 
的 超 调 量 会 大 一 些 , 但 是 由 于 我 们 在 设计 时 ,选取 了 图 10-30 的 曲线 色 , 超 调 量 很 小 ,有 较 
大 的 适用 范围 ,因此 对 于 不 同 的 工作 点 ,控制 特性 都 平稳 。 
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